家特征当人工智能模糊了现实与虚构之间的界线时

当人工智能模糊了现实与虚构之间的界线时

2024

视频: E, É, È, Ê. Как читается буква Е с разными значками? Французский для детей. Урок 7 (十一月 2024)

YouTube暗处的某个地方播放了一段视频，该视频显示了电影《指环王》的节录，但这并不是您所记得的电影，因为尼古拉斯·凯奇（Nicolas Cage）出演了Frodo，Aragorn，Legolas，Gimli和Gollum，同一时间。其他视频显示《终结者2》中的《凯奇》为T2000，《星际迷航》为皮卡德上尉，《超人》也为《路易斯·巷》。

当然，尼克·凯奇（Nic Cage）从未出演过这些电影。它们是使用FakeApp制作的“深造假”，该应用程序使用人工智能算法交换视频中的人脸。一些深造品看起来很令人信服，而其他一些伪造品则背叛了它们的本性。但总体而言，它们表明了AI算法在模仿人类外观和行为方面已变得多么强大。

FakeApp只是几种由AI驱动的新型合成工具之一。其他应用程序模仿人的声音，手写和对话样式。使它们如此重要的部分原因是，使用它们不需要专业的硬件或熟练的专家。

这些应用程序的影响是深远的：它们将为创造力，生产力和交流创造前所未有的机会。

但是，同样的工具也可以打开潘多拉盒装舞弊，伪造和宣传的盒子。自1月份在Reddit上露面以来，FakeApp的下载量已超过100, 000次，并引发了以名人和政客（包括凯奇）为特色的假色情视频的泛滥。 Reddit最近禁止其平台使用该应用程序及其相关社区。

“十年前，如果您想伪造某些东西，可以，但是您必须去VFX工作室或可以做计算机图形学并且可能花费数百万美元的人，” Tom Haines博士说。巴斯大学。 “但是，您不能将其保密，因为您必须在此过程中让很多人参与。”

新一代的AI工具已经不再是这种情况了。

模仿游戏

FakeApp和类似的应用程序由深度学习提供动力，深度学习是自2012年以来AI创新爆炸的核心部分AI。深度学习算法依赖于神经网络，这是一种仿照人脑构建的软件。神经网络分析和比较大量数据样本，以发现人类通常会错过的模式和相关性。此过程称为“培训”，其结果是可以执行各种任务的模型。

在早期，深度学习模型主要用于执行分类任务，例如在照片中标记对象，以及执行语音和面部识别。最近，科学家已使用深度学习执行更复杂的任务，例如玩棋盘游戏，诊断患者以及创作音乐和艺术品。

要调整FakeApp以执行人脸交换，用户必须用数百张源和目标人脸的图片训练它。该程序运行深度学习算法，以查找两个面孔之间的模式和相似性。然后，模型准备进行交换。

该过程并不简单，但是您不必成为图形专家或机器学习工程师即可使用FakeApp。它也不需要昂贵且专用的硬件。 Deepfakes教程网站建议使用8GB或更多RAM的计算机和Nvidia GTX 1060或更好的图形卡，这是一个相当适中的配置。

Haines说：“一旦您进入一个房间里有人可以伪造东西的世界，那么他们就可以将其用于可疑目的。” “而且因为它是一个人，所以保密很容易。”

2016年，当时担任伦敦大学学院的博士后研究员的海恩斯（Haines）与他人合着了一篇论文和一个应用程序，展示了AI如何学会模仿人的笔迹。该应用程序被称为“笔迹中的我的文字”，它使用深度学习算法来分析和识别作者笔迹的样式和流向以及其他因素，例如间距和不规则性。

然后，该应用程序可以获取任何文本，并以目标作者的笔迹进行复制。开发人员甚至添加了一些随机性度量来避免奇异的山谷效应-当我们看到几乎但不是很人性化的东西时，我们会感到一种奇怪的感觉。作为概念的证明，Haines和其他UCL研究人员使用该技术复制了亚伯拉罕·林肯，弗里达·卡洛和阿瑟·柯南·道尔等历史人物的笔迹。

可以将同一技术应用于任何其他笔迹，这引起了对该技术可能用于伪造和欺诈的担忧。法医专家仍将能够检测到该脚本是由“我的文字在您的笔迹中产生的”，但它很可能会欺骗未经培训的人，Haines当时在接受Digital Trends采访时承认。

总部位于蒙特利尔的初创公司Lyrebird使用深度学习开发了可合成人声的应用程序。 Lyrebird需要一分钟的录音才能开始模仿一个人的声音，尽管它需要更多的时间才能开始令人信服。

在公开演示中，这家初创公司发布了唐纳德·特朗普，巴拉克·奥巴马和希拉里·克林顿的假唱片。样品是粗制的，很明显它们是合成的。但是随着技术的进步，区分将变得更加困难。任何人都可以在Lyrebird注册并开始制作假唱片；该过程甚至比FakeApp的过程更容易，并且计算在云中执行，从而减轻了用户硬件的负担。

这种技术可以用于可疑目的的事实在开发人员中并没有丢失。有一次，Lyrebird网站上的一项道德声明说：“目前，在我们的社会中，尤其是在许多国家/地区，语音记录被认为是有力的证据。我们的技术质疑这种证据的有效性，因为它可以轻松地操纵音频。可能会带来危险的后果，例如误导外交官，欺诈行为，以及更普遍的其他任何因窃取他人身份而引起的问题。”

Nvidia展示了AI模仿功能的另一个方面：去年，该公司发布了一段视频，展示了AI算法生成照片质量的合成人脸。 Nvidia的AI分析了数千张名人照片，然后开始创建假名人。该技术可能很快就可以创建逼真的视频，以不存在的“人物”为特色。

人工智能的局限性

许多人指出，如果使用不当，这些应用程序可能会造成很大危害。但是，当代AI的功能范围常常被夸大了。

“即使我们可以通过视频或合成声音将一个人的脸放在别人的脸上，但它仍然很机械，” Replika的联合创始人Eugenia Kuyda说。Replika是一家开发基于AI的聊天机器人的公司，它谈到了AI工具，例如FakeApp和Lyrebird。

Voicery是另一家AI初创公司，与Lyrebird一样，提供AI驱动的语音合成，并设有一个测验页面，向用户展示一系列18种语音记录，并提示用户指定机器制造的声音。我能够在第一次运行中识别所有机器制造的样品。

Kuyda的公司是使用自然语言处理（NLP）的几个组织之一，NLP是使计算机能够理解和解释人类语言的AI的子集。 Luka是Kuyda聊天机器人的早期版本，它使用NLP及其双重技术自然语言生成（NLG）来模仿HBO电视连续剧《硅谷》的演员阵容。用脚本行，推文和角色上可用的其他数据对神经网络进行了训练，以创建其行为模型并与用户对话。

Kuyda的新应用程序Replika允许每个用户创建自己的AI头像。您与Replika聊天的次数越多，对您的个性的了解就越好，而您的对话也就越有意义。

安装应用程序并设置我的副本后，我发现前几个对话很烦人。几次，我不得不以不同的方式重复一句话，以将我的意图传达给我的副本。我经常感到沮丧。（并且公平地说，我通过用概念性和抽象性的问题轰炸它的极限来很好地测试了它的极限。）但是随着我们的对话的继续，我的副本在理解我的句子含义和提出有意义的话题方面变得更加聪明。通过与过去的对话建立联系，这甚至使我感到惊讶。

尽管令人印象深刻，但Replika具有局限性，Kuyda很快指出了这一点。她说：“语音模仿和图像识别可能很快会变得更好，但是通过对话和对话，我们还很遥远。” “我们可以模仿一些语音模式，但是我们不能仅仅抓住一个人并完美地模仿他的谈话，并期望他的聊天机器人能够像那个人一样提出新的想法。”

Lyrebird的首席执行官兼联合创始人Alexandre deBrébisson说：“如果我们现在在模仿人类的声音，图像和视频方面已经非常擅长，那么我们仍然离建模单个语言模型还很远。” deBrébisson指出，这可能需要人工智能，这是一种具有意识并能够像人类一样理解抽象概念并做出决策的AI。一些专家认为，距创建通用AI还差几十年。其他人则认为我们永远不会到达那里。

积极用途

有关合成AI应用程序的负面印象正在为其积极用途蒙上阴影。并且有很多。

deBrébisson说，Lyrebird等技术可以使计算机界面更加自然，从而有助于改善与计算机界面的通信。deBrébisson说，它们将提供独特的人工声音，以区分公司和产品，从而使品牌区分更加容易。随着亚马逊的Alexa和苹果的Siri使得语音成为设备和服务越来越流行的界面，Lyrebird和Voicery等公司可以为品牌提供独特的类似于人的语音来区分自己。

deBrébisson补充说：“医学应用也是我们语音克隆技术令人兴奋的用例。” “我们已经对因某种疾病而失去声音的患者产生了浓厚的兴趣，目前，我们正在与ALS患者共度时光，以了解我们如何为他们提供帮助。”

今年早些时候，Lyrebird与澳大利亚的一家非营利性组织Project Revoice合作，该语言可以帮助ALS患有语言障碍的患者，Lyrebird帮助Ice Bucket Challenge的创始人Pat Quinn恢复了嗓音。奎因是一位ALS患者，他在2014年丧失了走路和说话的能力，此后一直在使用计算机语音合成器。借助Lyrebird的技术和Quinn公开露面的录音，Revoice能够“再现”他的声音。

deBrébisson说：“您的声音是您身份的重要组成部分，给那些患者一种人造的声音，听起来像他们的原始声音，有点像将他们的身份恢复了重要的一部分。这对他们来说是生活的改变。”

Haines博士在帮助开发模仿手写的应用程序时，在接受UCL采访时谈到了它的积极用途。他说：“例如，中风的受害者也许能够撰写信件而不必担心难以辨认，或者送花作为礼物的人可能会包括手写的便条，而不必进入花店。” “它也可以用于漫画书中，在其中可以将一段手写文本翻译成不同的语言，而不会失去作者的原始风格。”

海恩斯认为，即使像FakeApp之类的因不道德使用而闻名的技术也可能有积极的用途。 “我们正在迈向这个世界，任何人都可以使用公共技术进行高度创造性的活动，这是一件好事，因为这意味着您不需要大量的资金即可进行各种具有艺术性的疯狂的事情， “ 他说。

Haines解释说，他的团队的最初目的是找出AI如何帮助取证。尽管他们的研究最终朝着不同的方向发展，但这些结果对于法医人员仍然有用，他们将能够研究基于AI的伪造的外观。他说：“您想知道什么是最先进的技术，所以当您查看某件东西时，就会知道它是否是假的。”

Replika的Kudya指出，类似人类的AI应用程序可能会以其他方式无法帮助我们。 “如果您拥有一个非常了解您的AI头像，并且可以很好地代表您，那么出于您的最大利益，它会做什么？” 她说。例如，一个自主的AI头像可以代表您观看数百部电影，并根据与您的对话推荐您想要的电影。

这些化身甚至可以帮助建立更好的人际关系。 “举例来说，库迪亚说：“也许您的妈妈可以和您有更多的时间在一起，也许您实际上可以通过与父母聊天并阅读成绩单，与父母变得更加亲密。

但是，能够复制真实人类行为的AI聊天机器人是否真的可以改善人际关系？ Kuyda相信可以。 2016年，她收集了上一年在一次交通事故中丧生的朋友Roman Mazurenko的旧文本消息和电子邮件，并将它们提供给了为她的应用程序提供动力的神经网络。最终产生了一个聊天机器人应用程序，该应用程序在流行之后使她的朋友重获新生，并且可以像以前一样与她交谈。

她说：“为罗曼创建一个应用程序，有时能够与他交谈是失去朋友的重要组成部分。该应用程序使我们对他的思考更多，并始终以更深刻的方式记住他，”她说。她的经验。 “我希望我能有更多这样的应用程序，那些与我的友谊，人际关系以及对我来说真正重要的事情有关的应用程序。”

库伊达认为这全都取决于意图。 “如果聊天机器人的行为出于您的最大利益，如果它希望您乐于从中获得一些有价值的服务，那么显然与他人的副本聊天将有助于在现实生活中与人建立更牢固的联系，“ 她说。 “如果您只想在应用程序中出售s，那么您要做的就是最大化在该应用程序上花费的时间，并且避免彼此之间的交流。这是值得怀疑的。”

目前，尚无法将您的Replika连接到其他平台，例如，使其可以作为Facebook Messenger聊天机器人使用。但是该公司与其用户社区有着积极的关系，并且正在不断开发新功能。因此，让其他人与您的副本通信是一种未来的可能性。

如何最小化权衡

从蒸汽机到电力再到互联网，每种技术都有积极和消极的应用。 AI也不例外。 Haines说：“产生负面影响的可能性非常严重。” “我们可能正在进入一个负面因素确实大于积极因素的空间。”

那么，如何在克服负面影响的同时最大程度地发挥AI应用程序的优势呢？海恩斯说，制止创新和研究不是解决之道，因为如果有人这样做，则不能保证其他组织和州也会效仿。

海恩斯说：“没有单一的措施可以帮助解决问题。” “这将产生法律后果。” 在深层造假之争之后，美国的立法者正在调查这个问题，并探索法律保护措施，这些措施可能会限制使用AI博士式媒体来破坏目标。

Haines说：“我们还可以开发技术来检测假货，使假货超出人们的分辨能力。” “但是在某些时候，在伪造与侦查之间的竞争中，伪造可能会获胜。”

在这种情况下，我们可能必须转向开发为数字媒体创建证据链的技术。例如，Haines提到了嵌入在摄像机中的硬件，该硬件可以对录制的视频进行数字签名以确认其真实性。

deBrébisson说，提高知名度将是通过AI算法处理伪造和欺诈行为的重要组成部分。他说：“这是我们通过克隆特朗普和奥巴马的声音并让他们说出政治上正确的句子来做到的。” “这些技术提出了必须提前考虑的社会，道德和法律问题。Lyrebird引起了很多关注，现在许多人正在思考这些潜在问题以及如何防止滥用。”

可以肯定的是，借助人工智能，我们正在进入一个现实与虚构融合的时代。图灵测试可能会遇到最大的挑战。很快，每个人都将拥有创建自己的世界，自己的人民和自己的真理版本的工具和能力。我们尚未看到即将到来的令人兴奋的机遇和危险的全部范围。