视频: intro Ashcrown (十一月 2024)
虚拟现实和增强现实是今年SXSW的热门话题,但对话范围不仅仅限于头戴式耳机。 要真正沉浸其中,体验就必须融合所有五种感官。 视觉,声音,触觉,气味甚至味道。
Crum还是斯坦福大学音乐与声学计算机研究中心和符号系统程序中心的兼职教授。 Crum是SXSW的一部分,是IEEE的“人类技术系列”的一部分。 她了解声音,甚至更多。
Costa:Poppy,非常感谢您今天加入我们。
克鲁姆:谢谢你有我。 很高兴来到这里。
因此,我们将谈论可听的事物,我们将谈论增强现实,我们将谈论一些虚拟现实,也许我们将谈论我们两个人不时经历的那些无痛的偏头痛时间。 首先,您在杜比的角色。 您的工作日是什么样的? 到办公室时你会做什么?
我们拥有庞大的计算神经科学家团队和精通感官感知的人员。 如果您回顾杜比的历史,甚至追溯到50年前,这是公司的核心,那么它始终是对人类经验的理解。 我认为这有助于区分我们对建筑技术的看法。
因此,每天,我们团队中的人员以及与我一起工作的人员都在研究各种技术。 我们不再只是声音,而是一种整体感。 我们有实验室,而且一天当中都会进行很多实验。
我们的新大楼有多达100个实验室,但是我们有一些惊人的生物物理实验室。 我的背景是神经生理学家-我们团队中的很多人都是一样。 每天都会发生人类生理学问题,以考虑新技术,并且在思考如何体验多感官信息以及如何展望未来如何消费如此丰富的信息方面,存在一些非常开创性的工作以及它如何影响我们的身体,它如何影响我们与他人互动和我们的感官的意义。
您在展会上讨论过的一件事,而我们在PCMag上涵盖的内容很多,就是这一听觉领域。 我认为很多听众都不熟悉可听性这个词。 当您听到“ hearables”一词时,这对您意味着什么? 这是什么意思?
现在,我认为这是一个尚待定义的术语。 我喜欢将其视为产品和可能性的很大一部分。 它是无线设备,在某些情况下甚至是有线设备。 因为Amazon Echo我将呼叫可听设备并且已将其插入,但它是具有麦克风或传感器的设备,但它正在从环境捕获数据,以某种方式使用这些数据来增强您的体验。 现在,有很多公司正在考虑在可穿戴空间中穿戴无线设备,将其穿戴在您的身上,但是如果我们看看Google Home和Amazon Echo,也有静态的可听设备,并且它们具有变革性。
听觉并不一定意味着它只是在增强您周围的声音。 它可能会获取有关您周围声音的信息,并以此方式以某种方式为您提供增强的世界体验。 您可能会想到它正在捕获……事实证明,耳朵是收集生物物理信息的好地方,这样您就可以在那里捕获许多信息。 显然,您可以想象,分析可以捕获有关您周围声音,对话的信息,并将其用作改善您的一天或优化您的方式。这也有很多问题。 我们认为值得一提的是一件事,我认为这是要转变的内容,并有助于定义此空间法规的变化。
现在,助听器是可以听见的。 助听器是一种增强现实设备,但是您拥有这类消费类设备,它们能够帮助减轻听力损失,有能力成为具有正常听力的人的增强现实设备,甚至有可能成为游戏设备。 您将获得这些领域的跨越,而医疗设备将进入更大的类别,而消费类设备将明显跨越这些界限,并为我们做很多类似的处理。
在助听器方面,人们认为助听器是指一旦您开始失去听力,您就可以得到助听器,这样可以使您的听力得到恢复,但是如果人们开始听音乐,可能会发生很多有趣的事情开始以……他们的听力正常来增强他们的听力,但是他们希望拥有比正常听力更多的东西。
绝对。 我一直坚信不要在我们说“现在我有听力障碍”的地方划定界限。 我们的听力,由于世界上的许多元素和声音,即使阿司匹林也是一种耳毒性,您必须-
那正确吗?
绝对。 您在听觉中融合的各种元素在20年代初开始下降,甚至在人们听到的一些响亮声音中甚至更早开始下降。
特别是西南偏南。
是。 助听器具有许多不同的功能。 是否可以控制将内容直接流式传输到设备(无线方式),元素的控制,信息的空间化。 我们谈论的事情-。 Google眼镜或其他公司的某些设备在获取信息,增强视觉感方面取得了巨大的推动力,而且,实际上-我们想要的-声音的组成部分对于让我们超越自己的目标至关重要。可能称为容量限制。 并从我们的世界中获取信息并真正将其表示为声音。
在我看来,让人们对声音和语音控制以及语音交互以及隐私产生不同看法的是诸如Google Home和Amazon Echo之类的设备,它们实际上是我们为该数字设备提供的第一个主流语音接口。世界带来了所有这些不同的后果,我认为我们才刚刚开始理清。 您在哪里看到市场走向?
这是一个很好的问题。 我必须说,我认为这些设备在许多方面都具有变革性,我是它们的坚强用户和共享者,部分原因还在于了解并了解它们将向何处发展以及如何在其中使用它们。我每天的生活。 人们愿意一直打开麦克风的想法是一个很大的飞跃。 我们该怎么办?
现在,声音真是太好了。 它使人们可以控制; 这使他们可以随身携带该设备作为生活中的助手。 未来十年,我不想在生活中控制更多事情。 我希望我的设备…我将更信任我的数据,而不是我会信任我了解某些情况下的需求,我希望这些设备成为…
期待的。
绝对。 无论我是否咳嗽和调节体温,我都希望他们积极主动,并能获取有关我周围声音的大量信息。 或者只是在需要时为我安排约会,或者也可以使我们的生活前进而不必控制所有设备。
您可以想象回声可以检测到您是否一直在嗅探。 它可以检测您听起来是否喉咙痛或是否在咳嗽,然后让您知道听起来像是在感冒。
要继续,并在您之前安排您的医生预约。 这听起来有点遥不可及,但与此同时,我认为我们将实现这一目标。 我认为将语音控制整合到我们生活中的步骤会让我们对此感到满意。
将来,我们唯一会感到不适的地方是什么事情不起作用,什么时候消失,什么时候不存在。
我在Echo上拥有丰富的经验,使我意识到它已经超越了我现有的互动方式,并可以帮助不同人群的人们。 但是,是的,我认为人们为可访问性考虑了很多这些设备,这太好了。 就像它可以为非常小的孩子或不同年龄段或不同人群提供的访问权限…
残障,缺陷或空白可以使用技术填补的人们。
绝对。 就我而言,我有一个亲戚在医院里,他几周前去世了。 我买了他,就在Echo出来的时候。 我给他买了一个Echo作为辅助功能设备。 这是转换。 我把它带到医院,这样的设备对于医院来说非常了不起。 隐私问题确实变得很重要,但我们主要将其用于在这种情况下播放音乐。
但是在这个时间和时间上,我的亲戚不是很发声,也没有说话,我们一直在Echo上播放音乐,我们认为这是他想听的音乐,Bach和非常平静的音乐,老实说,有些他说的最后一句话是,“我不是在开玩笑,我记得是,” Alexa,扮演Al Green。 他想要她的Al Green,Sly和The Family Stone,而此设备使他具有了可访问性。 它非常强大,而且功能强大。
那里有很多技术在起作用。 您已经有了一个事实,那就是Al Green可用,并且有一个庞大的音乐库,没有语音命令,然后您便拥有了语音命令本身,这使他可以亲自提出请求。 因此,那里发生了很多事情。
我想当您提出隐私问题时,这是另一个问题,那就是在Alexa预约我们的医生之前,我怀疑有些制药公司会提供给我们感冒药的餐桌,或者我们的过敏症正在起作用并提供Zyrtec,我认为这几乎是一个中间步骤,我们必须弄清楚谁将控制所捕获的所有数据以及我们以这种音频格式提供的数据。
我们必须拥抱它。 如果我们不考虑法规方面,也不考虑如何使人们满意地提供比当前更多的数据。 我认为亚马逊现在说:“我们只是在说Alexa时才在听,”但是这些设备要尽其所能,则必须一直在听。
目前,公司,保险公司存在着大趋势,无论是汽车保险还是健康保险,如果允许消费者追踪其数据(如果他们放弃其数据),都可以为消费者提供交易或降低利率的方式。 我认为它非常强大。 我认为这将是我们未来的一部分,这是毫无疑问的,但是共享数据的后果是什么,甚至还没有定义,并且很难预测。 因此,我们确实必须考虑未来的情况。
此外,我认为人们存在一个永久性问题,即“我不介意给我的医疗保健公司或保险提供者每周我要执行的步骤数”,但是该信息不会随处可见,并且这些步骤您将在30年后对本周进行搜索并编制索引,而我们今天生活的数字永久性想法实际上是人类历史上从未真正发生过的。 当您添加事实证明您可以一直在厨房里打开麦克风时,所有这些数据都将无处可寻。 亚马逊将永远拥有它。
那个未来是未成文的,我们也不知道后果如何。 我们尚未定义这些法规,但是由于许多事情可能会更改,因此将来甚至可能会更改。
这是另一回事。 从文化上看,我认为欧盟现在试图颁布更多的保护消费者的法规,但是由于数据存在,目前尚不清楚这意味着什么。 我们需要确保您旅行时的互操作性。 我们需要确保小型物联网设备的安全性。 这是非常关键的事情。 我认为像NIST这样的团体非常积极地解决这一问题。
当您查看杜比的功能以及他们正在使用的所有技术时,您会开始看到共同的主题,其中之一就是该公司实际上是在试图赋予人类超强的感官感知和超人的力量。 听起来很响。 听起来有些夸张,但是有很多例子说明人们使用技术获得了超人的力量。 我们可以谈谈其中的几个吗?
绝对。 因此,我来自神经生理学家的背景,他正在思考如何将这些东西集成到技术中,并且有几件事很重要。 当我们思考增强现实是什么或今天有什么技术可以为我们做…当我第一次加入杜比技术时,也许我们正在研究杜比视界,而杜比视界是一种高动态范围和更广泛的色域成像技术。 只是想知道一个想法,大约三年前您购买的典型显示器是每平方米300至400坎德拉。 月亮,自然的月亮大约是一千到两千,黑色路面上的阳光,每平方米要达到15, 000坎德拉。
因此,显示技术与我们实际的传感系统所能处理的相差很远。 在开发过程中,我们正在使用一些内容和设备,使我们能够将产生的亮度提高到每平方米20, 000坎德拉。
这并不一定是对比度,这不是分辨率,这是亮度。
是的,从感知和感觉的角度来看,对于许多观察距离,我们的感觉系统都可以最大限度地发挥您的感知系统可以处理的分辨率。 但是关于亮度和色域,我们离我们很近。 因此,令人兴奋的是:“好的,我们可以在这一领域增强体验,并可以在该领域发挥领导作用。” 真令人兴奋。
因此,在进行这些研究时,我认为是什么让我意识到了它的强大功能,并重新定义了沉浸式技术的本意。 我们正在看一些火情和坎德拉。 我认为我们正在以每平方米约四到六千坎德拉的速度玩游戏,而且我正在观看它,我感到我的脸只对火起了反应。 这个人在向我鞭打火焰,所以有一个很大的镜面火焰,真的很明亮,我想:“哦。” 显示器本身必须产生热量。 因此,我与一位主要开发人员进行了交谈,并问了他。 他当时想:“应该保持不变。” 因此,我得到了一个热像仪,并使用热成像来跟踪屏幕。 这是完全不变的。 但是我们能够在依赖于内容的人脸上显示出一致的变化。因此,仅根据到达视网膜的亮度,我的大脑就说:“好吧,我从未经历过如此明亮的火焰,而这种火焰并不真实,所以很可能我的大脑会像那场大火一样运转。真实。”
因此,现在当我们考虑沉浸式技术并创造超级大国并创造经验时,我们可以考虑使它们以一种自然的,真实的方式参与我们的生理系统,然后我们就可以对其进行增强。 我们有能力超越您在自然世界中可能会体验到的能力,并且变得非常强大。
是的,这是一个很好的例子。 我们还谈到了如何在PCMag中测试大量ER系统。 那里的工作中有非常有前途的技术。 我们始终专注于屏幕上的外观和分辨率,但是虚拟现实和增强现实的音频组件与视觉组件一样重要,并有助于销售体验。 您能否谈谈您在这里发现的内容以及为体验增加多少?
不仅在我们公司,而且在其他公司中,一个很大的趋势是,认识到没有一种感觉就无法学习一种感觉。 如果我们正在寻找AR和VR中的未来设备和整体设备。 目前,所有主要的VR设备都是可视的,但就我而言,助听器是增强现实设备,即使它们可能不想被称为“增强现实设备”。 它试图从基础生理系统中补充其状态。 耳蜗植入物是最早植入的生物物理装置之一。
如果您考虑我们在增强现实中想要什么? 我们想增强我们的世界经验。 我们希望它不会成为会干扰并且会给我们提供太多数据的东西,而这些东西使我们无法做过去的事情。 目前,我们正处在一种非常酷的体验中,但是我们并没有以我希望使生活中的平凡活动变得更好的方式来增强和触动。 并且因为这些事情得到了增强,所以使我们能够与人们更加互动。 我将在几秒钟内给出一个示例,但实际上,我们希望实现连接。 我们希望与我们的生活互动。 我们希望能够获得更多信息。 我们希望获得更多的经验,并且希望能够控制这些经验的丰富程度。
因此,如果我们获取所有可以捕获的数据或…更多数据并不一定总能得到更好的结果,但是如果我们试图增强视觉效果…我已经看到这种情况发生在军队中,我已经看到了发生在我要创建AR的技术上,并且我获取了我要增强的信息,并将其全部放入了视觉系统。 我把它们全部放在眼镜中,或者放在必须要看的地方。 好吧,我们的大脑无法处理那么多信息。 我们不能同时接受它。
所以这就是声音……从某种意义上说,我们有容量限制,但是您猜怎么着? 我们还有其他感觉。 突然间,我们打开了整个商店,我们可以去真正地用来改善我们的体验,然后猜猜是什么? 这是陈词滥调,但是关于创造生理体验,当我观看恐怖电影和恐惧电影时我该怎么办? 我关闭声音。 因此,这不仅是一个真正的内在部分,而且还是一个机会,就我们可以吸收多少信息以及可以处理多少信息而言,它可以改善和丰富我们的生活方式。 只需分开声音或在空间上分散声音元素,我们就可以同时处理它们,而无需动脑筋,信息完全没有用处。 它阻止我们通过做一件事来消耗我们所有的大脑和认知能力。 它确实打开了我们的态势意识以及我们可以做什么。
音频组件和所有这些VR事物,在我们开始测试它们时,我们都会在每条评论中都进行介绍,就是看起来像这样,听起来像这样,然后两者通常合起来应该大于部分的总和。
在AR或VR中,我们可以做很多不同的事情。 显然,创造空间化的体验很重要,但这是其中的关键部分。 杜比全景声(Dolby Atmos)是基于对象的声音传递和渲染的示例。 因此,当在Atmos中编写内容并且声音元素与数据包一起存在时,数据流将附加到该数据包中。 因此,您可以想象,这可能非常强大。 那可以告诉您声音应该在哪里。 无论您如何重新创建声音,它都具有该位置。 它具有宽度,响度,但也可以GPS坐标。 它还可以具有各种信息。 如果我们对正在发生的互动有一些了解,那么将来我们会对有关如何影响您的内容充满情感。
这些是将来可能发生的事情的类型。 如果您考虑使用AR设备,它可以提供很多信息。 目前,我们使用地图俯视我们的手机或汽车。 这些操作可以在实验室中很容易地完成,以创建一个超声波版本,该版本可以让您跟踪信息并告诉您(而不是口头告知),但可以通过ping告诉您声音在哪里,应该往哪里去。 问题是,我们必须确保它在各个用户之间都是健壮和一致的,这是一个更复杂的问题。
映射一个很好的例子,它仍然是基于屏幕的,当Google Glass出现时,您可以在视觉显示中看到所有这些信息,这是一个很小的小窗口。 我真正想要的是告诉我应该向右还是向左转。
是的
然后您就在耳朵旁,就可以给我语音命令。 就可穿戴解决方案而言,我认为这是比视觉系统更好的音频和声音系统。
绝对。 再说一次,嗯,不是,我想您已经讲到要点,那就是所有这些工具,现在,今天,我们拥有可以以惊人的方式使用的工具,包括神经控制和事物,但是问题不是让我们…而是为数据,技术,要尝试的用户体验选择合适的工具。 您需要针对您的个人以及他们要实现的目标进行上下文优化,并对其进行个性化设置,这与我们目前正在构建的产品存在很大差距。 惊人的技术,它将变得更加丰富。 但是它将会四处走动,我认为我们必须拥抱我们试图达到的目标,并思考作为人类系统如何才能最好地体验到这一点。
我最喜欢做的事情之一就是看其他物种。 您可以看看它是青蛙,苍蝇还是蝙蝠,它们具有这些超乎寻常的超能力,可以做的事情远远超出了他们的身体,对他们的大脑可能会粗暴地看得出来。 了解他们如何解决该问题以及更多原因,以及他们的进化为何为他们解决了该问题,这为我们提供了见解。 我们必须这样思考。 我们必须更多地考虑系统的环境压力是什么,技术如何最好地帮助我们解决这一问题?
提供越来越多的数据可能并不总是正确的解决方案。
很少,很少。 我的意思是,使我们成为人类成功的是我们的大脑被抛弃了。 我一直在谈论幻想,我喜欢幻想。 它们很有趣,但是当我们的大脑弄错了东西时,它们也是这种美好的见解。 如果我们完全按照世界的实际经验来体验数据,那么您实际上会陷入无法正常工作的病理状况。 而且我们的大脑不断在做的事情是帮助我们权衡某些信息,甚至不会注意到不同的信息。 如果我们注意到光线造成的所有亮度变化,我们将永远看不到整体物体。 我们需要发挥作用,我们需要知道要采取什么行动,这就是强大的力量。
我问你一些问题,我问所有客人。 第一,什么让你彻夜难眠? 您最关心未来什么技术趋势?
两件事情。 我想我们已经涉及到一个了,创建此类超级大国的功能如此强大,我们可以使用AR和VR来做。 我希望我们能将正在构建的所有技术视为工具,并考虑使用最简单最有效的工具(我说是健壮的),但这在我们所有用户中都是一致的,以获得预期的体验而不是最性感,最有光泽的那个。
但是另一个是-它实际上是关于数据的。 始终保持麦克风的聆听能力非常强大,它将推动我们的技术向前发展,使我们的生活向前发展。 但是我们必须对这些数据的发生情况感到满意。 无论是自动驾驶汽车还是可听设备,或者仅仅是物联网设备的安全性,我们都必须对法规感到满意。 如果我们没有强大的法规,标准和理解,并且在很多情况下,对于驱动某些概率决策的算法和某些设备背后的AI没有透明性,我认为这将延迟并阻碍创新。 这可能会延迟该技术的功能,从而对许多人产生积极影响。 我希望看到这种情况。 因此,我认为这将与标准和法规有关,以帮助使它们变为现实。
从积极的方面来说,您最兴奋的是什么? 您认为这将改变世界,让您每天上班都感到兴奋吗?
有一种趋势和转变是我们不会考虑的。 我们正在整体考虑技术。 我们正在考虑它对视觉和声音的共同影响。我们正在考虑我们的整个生理系统,以及我的感觉和情感。 人们现在关心的事物以及我们描述技术的影响的方式,对于人与人之间的联系意味着什么,以及对我们的体验所具有的力量,意味着什么。 我绝对认为这是一个新方向。
因此,关于您喜欢的产品,服务,技术产品,改变了您的生活。 是否有什么像您这样突出的东西:“这是使我的生活每天变得更好的事物?”
静态可听设备。 我每天都使用Echo,而且我已经看到它在如此广泛的代沟和用例中使用了。 我真的很高兴这样的技术正在发展,现在真的处于发展的早期阶段。
因此,如果人们在听这个演讲并且对您的工作感兴趣,他们如何在线找到您并与您互动?
您可以在LinkedIn Poppy Crum上找到我。 您也可以在Twitter @poppycrum上找到我。