前瞻性思维 智能助手:siri之后会怎样?

智能助手:siri之后会怎样?

视频: therunofsummer (十月 2024)

视频: therunofsummer (十月 2024)
Anonim

智能助理(Siri,Google Now,Cortana等)已经从几年前的好奇心和客厅技巧变成了许多人日常生活中必不可少的工具。 上周,我参加了Opus Research在纽约举行的智能助手会议,并对该软件在各个行业中取得的进展印象深刻,包括金融,保险和医疗公司在建立特定代理商方面的进展。

Opus Research的创始人丹·米勒(Dan Miller)解释说,语音识别等许多核心技术已经存在了20多年。 尽管他最近看到了一些重大改进,而不是一场革命,但他说“我们正处在进化的道路上”,许多产品具有不同的功能。 他指出,有数百种企业智能助手可用于使用固定数据集以纯英语进行基于文本的简单对话,以及用于导航网站或FAQ等。 另一方面,可能只有几十个“动态,人性化的应用程序”更具有对话和上下文意识。

Miller指出了在会议上获奖的应用程序。 Amtrak的Julie最初是一家交互式语音响应电话服务代理,但几年前,它已发展成为一个可在网站上工作的代理,该网站基于Next IT的代理来指导旅行者通过Amtrak.com。 墨西哥西班牙电信有一个名为Nico的代理,该代理具有化身,并且还基于AgentBot的平台通过Twitter和Facebook提供支持。 ING荷兰拥有Inge,该应用程序可让您使用Nuance的语音生物识别技术检查您的银行帐户余额或通过语音转帐,以验证您的身份。

荣誉奖包括医疗保健应用程序,例如可帮助您选择医疗保健计划的应用程序。 我在展会上听到的其他应用程序包括Domino's Pizza,它有一个名为Dom的应用程序,可让您使用语音订购比萨饼。 宝马公司(BMW)在其Up2drive汽车融资部门中拥有虚拟代理人。

Nuance的Brett Beraneck谈到了深度学习神经网络的进步如何改善了诸如自然语言理解以及语音识别之类的东西,以及如何将它们融合在一起以引起对该领域的更多兴趣。 Nuance的Nina助手是一个早期的例子,从那时起,它已经发展到很多特定的应用程序,从保险公司的交互式语音响应系统到购物应用程序。 这些应用程序中的每一个都有不同的个性,具体取决于它试图帮助您做什么。

他讨论过的一项重要的新功能是语音生物识别,其中您的语音代替了密码。 他谈到了欧洲ING之类的公司如何开发不仅使用语音识别和自然语言处理,而且还开始使用语音识别呼叫者的代理。 他说,这比传统密码既安全又自然。

尽管最近的研究担心语音记录会欺骗此类系统,但Nuance指出,当今的技术包括旨在从已记录的语音中发现异常的功能,并指出了其他从不同角度进行的研究。 此外,他说,设计人员可以将不同级别的语音生物特征识别功能用于不同的功能,例如使用简单的识别来检查帐户余额,或要求您重复随机的单词序列以进行大量的汇款。

语音生物识别技术似乎似乎正在吸引一些注意。 在上周的Gartner研讨会上,有关金融服务中“酷客户案例”的会议包括使用此功能的Citibank应用程序。

MyWave拥有一个名为Frank的助手,该助手可以由多个企业启用,以使您可以通过更多的对话方式与他们互动,而不是让每个企业自行发展。 最初的用途包括一家新西兰银行和一个名为Saveawatt的应用程序,旨在帮助您选择电力供应商。

首席执行官杰拉尔丁·麦克布赖德(Geraldine McBride)解释说,该公司正试图创建助手,以通过所谓的“客户管理关系”或CMR来弥合客户与服务应用之间的鸿沟,这是对传统CRM应用程序的一种改造。 她说,一个很大的不同是,客户负责他或她的所有数据,而不是业务。

另一个相对较新的公司,Expect Labs有一个名为MindMeld的产品,可作为许多公司的后端,这些公司希望提供语音界面来代替传统界面并处理问题和答案。 这可用于多种应用程序,例如仅询问名称并让系统查询多个系统即可观看电视节目。 (亚马逊的消防电视具有其中一些功能,但未与您的有线机顶盒集成,而Expect Labs的投资者之一是有线电视公司Liberty Global。)

首席执行官蒂姆·塔特尔(Tim Tuttle)解释说,MindMeld倾向于使用大多数设备中已经可用的语音识别,而是专注于自然语言理解和构建可用信息的知识图。 他说,该公司正试图扩展该系统,以包括来自多个来源的更多信息,并打破大多数此类系统中所包含的不同类别信息的层次结构。 他说,真正理解问题意味着能够理解各种类别的意图。

我从许多与会者那里听到的一件事是统计数据,表明现在所有Web搜索中的大约10%是通过情报代理完成的。 (人工智能先驱吴伟达说,去年在百度进行语音搜索时确实如此,还有一些人说谷歌现在也是如此,但我还没有听到任何第一手确认。)

展望未来,Opus Research的米勒(Miller)说,仍有大量工作要做。 系统的基本准确性有很大的改进空间,尤其是在从您所说的内容转变为要做什么之后。 他在会议上提到了施乐PARC首席执行官斯蒂芬·胡佛(Stephen Hoover)的讲话,他说当今的系统在理解我们的意思上已经达到90%的准确率,但是10%仍然是一个问题,因为这是大多数人在处理时所记住的一个系统。 Miller表示,还有更好的个性化设置的空间,因为如果系统知道与之交谈的人,则可以提供更好的结果。 例如,他指出,Facebook知道谁在使用该系统,因为您已经登录; 并说与更多的代理商无缝地合作将变得越来越重要。

当然,这是一个有趣的类别,我希望我们所有人都将花费更多的时间与我们的电话和计算机交谈,并与不太人性化的代理进行交互。 我发现这是当今计算机中最吸引人的趋势之一。

智能助手:siri之后会怎样?