意见 AI,ml如何将语音转换为文本,语言翻译| 蒂姆·巴贾林

AI,ml如何将语音转换为文本,语言翻译| 蒂姆·巴贾林

视频: Орфография французского языка. Когда ставить accent grave, а когда – accent aigu? (十一月 2024)

视频: Орфография французского языка. Когда ставить accent grave, а когда – accent aigu? (十一月 2024)
Anonim

Google I / O上最令人印象深刻的演示之一是Duplex,这是一种人工智能技术,它可以打电话到营业场所(在这种情况下,是美发沙龙和餐馆)来预约。 排队另一端的员工似乎并不明智,Duplex轻松应对了挑战,就像餐厅说不接受小宴会预订时一样。

这项特别的AI公告在Google I / O上得到了广泛报道,但是在开发者大会上展示的所有产品和服务中都普遍存在AI和机器学习。 只需看一下这张图,Google在I / O开放前一天的一次针对AI的分析师活动中就显示了该图。

那场比赛还显示了另外两件事,我认为这可能会改变游戏规则。

首先是如何将AI应用于语音到文本的翻译。 目标是在未来几年内使用AI和ML将其精度提高到99%。 就是说,他们在其中向各种G-Suite应用程序指示评论的演示已经非常准确。 我们还看到了Smart Compose的更深入的演示,其中一个人在Gmail中写一个句子,然后Smart Compose根据第一个句子的上下文为您写下一个句子。

各种语音识别产品(例如Dragon Dictate)已投放市场多年。 但是这些程序依赖于本地化的软件,并利用了每次发行时可用的当前处理能力。 这些年来,这些程序确实做得更好,但是如果您投放AI和ML广告,那么准确率肯定会提高。

Google理解语音转文字与我们日常生活之间的重要性。 驾驶时应答消息时,准确的语音转文本界面至关重要。 这是在可穿戴设备或智能手机上回复电子邮件或短信的一种有意义的方式。 当使用混合现实眼镜时,它将最终成为一种有价值的输入,其中将语音用作导航过程的一部分,并且各种类型的AR应用程序都需要语音转文本。

第二个是Google Translate中AI和ML的使用方式,当实时进行翻译时,这将是真正的变革。 作为只会说英语的国际旅行者,这种翻译将是天赐之物。 有一些手持设备试图将您所说的内容翻译成本地语言,但是它们目前有很多限制。

Google着眼于这种类型的翻译,因此可以肯定地说,我们很快就会在Android手机上看到更准确的语言翻译方面的一些真正突破。 苹果还在语音和文本翻译的各个方面进行了AI和ML研究,因此它也可以与潜在合作伙伴一起,有朝一日在iOS上提供移动语言翻译解决方案。

AI和ML将对语音到文本的转换产生巨大影响,其最显着的效果可能是作为AR和VR或混合现实眼镜中的UI的一部分。 就个人而言,语言翻译最让我兴奋,因为这会使我的世界旅行更加轻松。

AI,ml如何将语音转换为文本,语言翻译| 蒂姆·巴贾林