家 Appscout IBM Watson CTO为何增强智能胜过AI

IBM Watson CTO为何增强智能胜过AI

2024

视频: IBM Watson & Problem Solvers: Charissa Thompson (十一月 2024)

快进的这一集记录在纽约市的IBM Watson体验中心。我的客人是IBM Watson副总裁兼首席技术官Rob High。

在IBM的多个团队中进行高级工作，包括工程，开发和策略。他是人工智能领域最清醒的思想家之一，我们的对话涵盖了技术正在重塑我们的工作，我们的社会和我们的生活的许多方式。阅读并观看下面的对话。

丹·科斯塔：人们对人工智能的主要误解是什么？

罗伯·高（Rob High）：我认为与人们谈论AI时，我们遇到的最普遍的问题是他们仍然生活在这个世界上，我认为好莱坞已经放大了这样一种观念，即认知计算AI就是要复制人类的思想，并且真的不。诸如图灵测试之类的事情倾向于强调，我们正在衡量的是AI能够与愚弄人竞争以使您相信您所处理的是另一个人的想法，但这实际上并不是我们发现最大的实用程序。

这甚至可以追溯到，如果您查看几乎所有其他已创建的工具，那么当我们的工具放大我们，扩大我们的影响力，增加我们的实力时，它们往往是最有价值的工具，当他们允许我们做我们人类无法做到的事情时。这确实是我们也需要考虑AI的方式，在某种程度上，我们实际上称其为增强智能，而不是人工智能。

让我们谈谈这种转变，因为它是一种全新的计算类型。这是计算从我们俩共同成长的过程的演进，是一种程序化计算，在该过程中，您将使用计算来完成非常复杂的过程并进行回答，再到认知计算，后者的运行方式有所不同。您能解释一下这种过渡吗？

可能最大的显着差异是它的概率很大，而编程计算实际上是在布置所有条件语句，这些条件语句定义了您要关注的事物以及如何对其进行响应。这是高度确定性的。在数学上非常精确。使用经典的编程计算机，您可以设计一个软件。因为您知道数学模型代表什么，所以可以对其进行数学测试。您可以证明其正确性。

认知计算的概率更大。这主要是关于测试我们关注的空间的信号（无论是视觉，语音还是语言），并试图找到这些信号中的意义模式。即使那样，也永远没有绝对的确定性。现在，部分原因是因为它是计算方式，也是因为这是人类经验的本质。如果您考虑我们所说或看到或听到的一切，品尝，触摸或闻到的东西或我们感官上的任何东西，那么作为人类，我们总是试图评估其真实含义，有时我们做对了。

当我听到声音序列时，真的有这个词的意思吗？当我看到这个单词序列表示此陈述时，该概率是多少？当我看到这个形状和我正在查看的图像时，它是那个物体的概率是多少？即使对于人类来说，这也是一个概率问题，在某种程度上，这始终是这些认知系统运作的方式。

如果有人遇到您要解决的问题，他们会认为有一个认知计算解决方案，他们会去Watson，他们说：“看，我们将使用Watson尝试解决这个问题。” 开箱即用，沃森做得并不多。他们需要教它如何解决他们的问题。您能谈谈入职过程吗？

实际上，我们应该谈谈这两个方面。一个是在一段时间之前，我们意识到认知计算这个东西确实比我们大，比IBM大，比行业中任何一家供应商都大，比一个或两个不同解决方案领域中的任何一个更大我们将要专注于此，并且必须将其打开，这是当我们从专注于解决方案转变为真正地处理更多的服务平台时，每个服务实际上都分别专注于服务的不同部分。问题空间。对于语音而言，它是一个组件，它严格地专注于以下问题：尝试讲话并识别讲话中表达的单词，或者拍摄图像并尝试识别图像中的内容，或者拍摄语言并尝试理解其含义，或进行对话并参与其中。

首先，我们现在要谈论的是一组服务，每个服务都做一些非常特定的事情，每个服务都试图处理我们人类经验的不同部分，以及任何人都在构建应用程序的想法，任何想要解决社会，消费者或业务问题的人都可以通过采用我们的服务，然后将其组合到应用程序中来实现。这是第一点。

第二点是您刚开始的那一点，好的，既然我已经获得了服务，那么我们如何才能使它完成我们希望它做得很好的事情？该技术确实是一种教学。这些系统的概率性质基于以下事实：它们基于机器学习或深度学习，并且必须教那些算法如何识别表示信号集中含义的模式，您可以通过提供数据来做到这一点，数据代表了您遇到的那种情况的示例，您可以在标签上这样说：“当我听到声音的组合时，就意味着这个词。当我看到这种像素组合时，就意味着宾语。” 当我有了这些例子时，我现在可以带您进入认知系统，这些认知服务，并教他们如何更好地认识我们想要做的是什么。

我认为其中一个很好地说明了这一点的例子是在医学领域，Watson在此领域帮助医生做出决定并解析大量数据，然后最终与他们合作进行诊断。您能否谈谈培训是如何进行的，然后解决方案如何结出更好的结果？

我们在肿瘤学领域所做的工作就是一个很好的例子，它实际上是由多种不同类型的算法组成的，这些算法在需要执行的全部工作中以不同的方式使用。例如，我们首先查看病历，查看您的病历，然后使用认知系统查看临床医生在与您合作多年以来所记录的所有笔记，并找到我们所说的相关的临床信息。这些医疗记录中与您将要进行的咨询相关的信息是什么？这样做，进行人群相似性分析，试图找到其他与您有很多相似性的患者，因为这将告知医生如何考虑不同的治疗方法以及这些治疗方法如何适合您以及您将如何对这些治疗做出反应。

然后，我们进入所谓的护理实践标准，这是相对明确的技术，医生会分享他们将如何针对不同类型的疾病治疗不同的患者，并认识到这些疾病实际上是为普通人设计的。然后，在此之上我们称之为临床专业知识。在不同疾病中最好的医生教过要寻找什么，离群值在哪里以及如何对不同的护理规范标准进行推理，哪种最合适，或者如何通过这些不同的护理规范采取不同的途径，以及现在以可能的最佳方式应用它们，但最后查阅了临床文献，PubMed上成千上万，60万篇有关该领域科学进展的文章均与现在提出该治疗建议有关。

所有这些都是我们在该过程的不同阶段中应用的算法的不同方面，所有这些都是通过将世界上一些最好的医生放在这些系统的前面并让他们使用该系统并对其进行更正来进行教授的当他们发现问题出在哪里，并让系统从使用中本质上学习如何提高自身性能时。我们专门在肿瘤学方面使用该方法，以帮助告知该领域的医生他们可能不熟悉的治疗方案，或者即使他们有所了解，也可能没有任何实际经验，也没有真正了解他们的患者将如何应对以及如何从患者那里获得最有效的响应。

基本上所做的就是使专业知识民主化。我们可以聘请纪念斯隆·凯特琳（Sloan Kettering）最好的医生，他们的好处是每年可以看到成千上万名患有相同疾病的患者，因为他们从中获得了如此巨大的专业知识，并将其吸收到认知系统中，带到了社区或区域诊所环境中，这些医生可能没有太多时间在大量不同患者中从事相同疾病的治疗，这使他们有机会从认知系统中现已掌握的专业知识中受益。

我认为分配专业知识的想法首先是一项艰巨的任务，但是一旦做到这一点，就能够将其真正分布到整个星球上，您将拥有Memorial Sloan Kettering最好的医生能够在中国，印度和小型诊所中分娩，我认为这非常不寻常。

它对我们的福利，健康以及对社会有益的事物具有巨大的社会影响。

另一方面，与人们有关的人工智能问题是，它将取代人们，它将取代工作。它与自动化运动息息相关。让我印象深刻的是，留在医学领域的放射科医生。放射科医生每天要看几百张幻灯片。 Watson或基于AI的系统可以复制相同类型的诊断和图像分析。从现在开始的十年后，您认为在美国聘用的放射线医生会越来越多吗？这样对行业有何影响？

影响实际上是在帮助人们做得更好。这真的是关于……以医生为例。如果医生现在可以根据真实证据，科学最新事实支持，更针对具体患者的具体情况做出更明智的决策，则可以使他们实际做得更好。对于放射科医生来说，它可以使他们看到图像中否则可能会错过或不知所措的东西。这不是要替换它们。这是关于帮助他们更好地完成工作。

它确实具有与我们在社会中创造的每个工具相同的动力。我想说的是，如果您回顾一下自农业革命以来的近一万年的现代社会，我们作为人类社会已经在建造工具，锤子，铁锹，液压系统，滑轮，杠杆等当这些工具真正在做的事情是放大人类，放大我们的力量，放大我们的思维，扩大我们的影响力时，这些工具中最耐用的。

这实际上是考虑这些东西的方法，当它允许我们做比自己能做的更好的事情时，它将发挥最大的作用，而当人与工具的组合大于任何一个时，他们中的每个人都会自己。这就是我们考虑的方式。这就是我们不断发展技术的方式。那就是经济效用所在。

我完全同意，但是我确实会因为这些智能系统带来的效率而将某些行业排除在外。

他们将被过渡。是的，它们将要过渡。我不想这样说来减少这一点，但我也想确保我们不会将其视为消除工作。这是关于改变人们执行的工作。我举一个例子。关于这可能如何占用呼叫中心工作的大量讨论。好吧，你猜怎么着？呼叫中心代理有很多工作是他们不需要做的，他们不喜欢做的，这剥夺了他们做更有趣的事情的能力。

我们在呼叫中心看到的客户流失很大程度上是由以下事实造成的：如果您考虑担任呼叫中心代理的工作，那么您正坐在电话的尽头，整天聆听愤怒的客户在问同样的问题。一遍又一遍，晚上很难回家对那天的工作感觉很好。当您遇到这种情况时，很难向您的朋友和家人炫耀您的这份工作以及您做得如何。

如果我们可以通过对话代理获得认知系统以减轻一定比例的负担，那么假设有30％的电话打进来，可以快速，有效地回答客户最常见和最紧迫的问题，并处理那些平凡的工作，那么在解决了所有这些问题之后，人们固有地需要更多人性化的问题，然后您将转到该呼叫中心座席。他们与该客户打交道的问题更有趣，更具挑战性，要求他们投入更多的智力精力，而且他们正在与一个满意的客户打交道。他们来了一些快乐。他们并没有对他们的问题大加赞赏。

对于呼叫中心代理，它实际上可以改善他们的工作。实际上，这使他们有可能更好地完成自己的工作，并因此而更加充实。同时，对于客户，对于消费者来说，他们的最紧迫问题得到了迅速解决。他们没有搁置10分钟。他们不是在等只有正确的知识就被路由到合适的人。他们正在获得最需要的信息，并可能通过更好的决策，更好的信息或至少更一致的信息来继续他们的生活。它实际上使该方程式的双方受益。

这真有趣。我今天看到的一些演示是，呼叫中心应用程序可以非常有效地预测和检测正在打电话的人们的情绪状态，因此这不仅仅是事务性的。实际上，它可以很好地读取该行另一端的人的状态。

如果您考虑的话，这真的很重要；对话有两个要素。一个是人们开始说的通常不是他们真正想要的。如果我说：“我的余额是多少？” 好吧，那真的不是我的问题。是的，我需要知道我的帐户余额，我需要知道我有多少钱，但是我的问题是我想买东西，或者我想弄清楚如何让钱处于正确的支付位置我本月的帐单，或者我想为孩子的学业积蓄。我的问题比我问的第一个问题还要大，而谈话应该是关于解决这个真正的问题。

对话的第二个共同特征是，对话通常带有一种情感弧度。人们来到在一定的情绪状态，谈话的一部分，是通过一个情感的转变，往往意味着从生气到现在被满足他们的移动来移动它们。在某些对话中，我们可能会参与其中。实际上可能会有点发热。您会看到一种情绪弧线，这种弧线可能始于平静，然后进入更具争议性的讨论，最终得到解决。

保持敏感并意识到所涉各方的情绪状态是有效进行对话的重要组成部分。

您认为当今有哪些其他真正具有变革性的应用程序可用？

我认为他们中的任何一个人，我们正在做的就是以激发他们灵感的方式吸引用户，客户。最终，对我而言，再以对话为例，通常当人们开始对话时，我们带着一个想法来到会议桌上。你有个主意我有个主意。最初的想法是对话的开始，在对话过程中，我们不断发展这些想法。我们混合它们。我们合并它们。我们可能会打折或扩大它们。我们逐渐发展到可以从谈话中获得更好的主意的地步。理想地。

要做到这一点，不仅要有让与取的余地，还需要有一个如何激励某人的要素？您如何使人们激发想象力？您如何使他们思考以前从未想过的事情，或以他们从未想到过的眼光来看待某些事情，或者如何看待另一种观点，使他们走上一条他们甚至都不知道的道路想一想，问他们不想问的问题？这些就是例子，那些是我认为最有希望并会给人们带来最大利益的情况。

是今天发生的事情，还是随着技术的发展而需要发生的事情？

不，正在发生。我们现在有发生这种情况的例子。实际上，以肿瘤学为例，对于世界上最好的医生来说，目前提出的治疗方案在大多数情况下可能对他们是显而易见的。十分之一的情况下，他们可能会说：“好吧，请稍等，这是一个有趣的主意。” 它不会那么频繁，但是，就像您前面说的，如果我们现在将其带到社区设置，区域设置以及专业水平不高的地区，则该系统可以引入新的想法，新的治疗方法，实际上就是引入新的想法。我们已经看到了。

然后，当然，超越了我认为已经成为经典的聊天机器人方案，我认为我们当中的一些人开始在不同的示例中看到了现在的情况，即如果有人在其信用卡上发出信用卡欺诈警报并且他们去了今天的聊天机器人，可能只是，“您是否进行了该交易？如果可以，那么还好。如果没有，那么我们将对取消交易进行一些操作，”到现在，“好吧，您需要一张新的信用卡。什么地方是最好的拿给我们的礼物？我们应该邮寄给您吗？我们不应该邮寄给您吗？哦，您已经准备好进行这次旅行了。无法将其邮寄给您。我们必须比以前更快地将其寄给您。

“哦，你要去海外。也许这里有你以前从未接触过的信用卡选项，不知道，我们在哪里可以更好地处理有利于您的货币兑换。哦，您正在使用它进行商务活动“这是一次海外旅行。您正在用它来支付商业费用。好吧，这是一张信用卡，其利率对此更为合适。” 这些都是非常简单的示例，但是它们每个都提供了一组新的想法，这些想法通常在您今天的简单聊天机器人中通常不会发生，但实际上可以为人类带来很大的力量。

有趣的一点是，当您遍历所有这些选项时，过去将是脚本。会有一个带有几个分支的脚本。可以预先定义。当聊天机器人执行此操作时，这实际上是不同的，它实际上是对您提供的信息和您已经提供的信息做出反应，并引导您进入未编写脚本的路径。它知道您正在旅行，但不一定要告诉您。它从您的电子邮件历史记录中找到了该信息。

它可以找到沿途发现的关于您的事物。

我们讨论了肿瘤学，因为这是一个很好的例子。我们之所以谈论聊天机器人，是因为大多数人已经与他们进行了一些互动。但这是一项真正可以扩展到每个行业的技术。很难想到一个没有某种认知成分的行业。是否有一些人们尚未想到的例子？

对我来说令人惊奇的是，每一天有人都在想出另一个新主意。这就是为什么我认为我们处在一个非常有趣的阶段，因为通过专注于将认知能力方面的内容分解为基础服务，这实际上使人们得以释放他们的想象力，去追求我们已经拥有的想法以前从未真正考虑过，是否使用视觉识别来测量景观。

例如，在加利福尼亚州，一家公司使用视觉识别来查看地形和拓扑结构，并在图像中识别出混凝土表面，沥青屋顶表面，草表面，树木和灌木以及这些东西之间的差异，从而例如，估计消耗了多少水，可能在哪里漏水，以及可以采取哪些措施来提高用水效率。

或者，在法律舞台上，利用这些东西来解决问题，并帮助律师阅读数以百万计的背景材料，就像在大海捞针中找针一样。与该特定案例真正相关的那张纸在哪里？尝试对所有内容进行排序。机会是巨大的。

我认为这些资格之一就是需要解析大量数据。您讨论了病历，并且能够扫描病历以获得相关信息。在您的一生中，这些记录可能长达数百页。就是这样，也许您的家庭医生对此有所了解，但他们不会记住全部，而系统永远不会忘记。

是的在与您会面之前，医生可能有五，十分钟的时间来查看该病史，但是在您的病史，您的过去中可能存在各种各样非常相关的信息，在任何其他情况下，他们只会错过因为他们没有时间，如果他们有时间，那将会有所作为。

想想一个情况，如果一个女人告诉她的医生说她的母亲两年前刚刚死于乳腺癌。好吧，很可能医生会在那个记录中指出这一点，但是目前，如果这个女人来她的乳房出现肿块，并且如果那个医生没有看到那件事，那么，那是一个非常重要的缺失信息。现在，也许他们会通过与患者交谈来重新发现它，但也许不会。当这样的事情如此紧密时，您真的要冒着不知道的风险吗？

您提到了其中有很多数据的地方，这些东西可能会有用的总体特征。是的，但实际上是我们作为人类的任何方面的认知能力开始达到极限的时候。我们擅长阅读。我们可以阅读一些东西。我们可以吸收它。我们可以适应信息，并像人类一样以非常强大的方式利用信息。但是我们不是很擅长读取大量数据。我们不能…一天阅读数万，数十万，数百万页文学作品的想法远远超出了我们的能力范围。

问题是，当我们成长为一个每天产生的信息量呈指数增长的世界时，如果我们不充分利用其中包含的信息，那么有多少信息是对我们需要做出的决定绝对至关重要吗？如果不是我们阅读的信息量，那就是：我们要吸收多少？我们能回忆多少？我们是否能够看到与我们的决策相关的信息中的小模式？

作为人类，我们有很多事情擅长。还有很多事情我们还不是很好，这就是我认为认知计算真正开始发挥巨大作用的地方是何时能够弥合这一距离来弥补这一差距。

显然，这是我们要进入的世界。我们准备得如何？您如何看待我们的教育体系，经济，政治结构？以这种类型的认知计算为组成部分，我们如何为生活在这个世界上做好充分准备？

这真有趣。这利用了我们作为人类拥有的关键价值点之一，那就是我们的适应能力。如果仅从离散的角度看待它，这将走向何方，如果我们要向前迈进10年然后再说：“我们将在10年后走向何方？我们为此做好了准备吗？” 答案可能是，不。我们还有很多工作要做。但是，人类具有这种非凡的能力，可以随时随地适应并随着周围环境的变化而成长。

回想十年前，当智能手机真正才开始对我们可用时，更不用说流行了，以及过去十年中我们作为一个社会经历了多少变化。无论有没有智能手机，每天都要想一想自己的生活。我们可以抱怨它会从其他经验中带走多少，这也许是正确的，但问题是，即使我们为一个社会做好了准备，但十年前我们并没有花很多时间来烦恼实际上，在过去的十年中，我们经历了很多变化，而当我们吸收这种变化并开始以非常有效的方式利用它时，我们可能还没有完全意识到这些变化。

我们有很多事情要做。随着时间的流逝，我们将要做很多事情，我们将经历很多成长，教育和政治以及我们必须经历的许多其他事情都需要不断变化，但是我们会的。

我们将解决我的最后一个问题。您最关心什么技术趋势？有什么可以让您彻夜难眠吗？

我认为我现在最大的担忧是人们确实需要承担责任。我们作为技术的工程师和提供者，技术的消费者，对技术负责的人，确实确实需要保持警觉，并从头开始思考现在想做些什么，以保护自己并为正在发生的变化做好准备。不是因为我们不适应它。我们会。当然，问题在于，在适应它的过程中，我们也不会意识到正在做什么，这将如何影响我们，以及人们可能会在哪些地方以我们不喜欢的方式利用该技术，我们不一定会想要，或者回想起来。

我确实认为我们需要意识到这一点，并思考我们所做的事情，以及我们不希望这种技术在我们的生活中发生。具体来说，特别是卖方，我们作为该技术的供应商，以及使用这些技术组件并从中使用应用程序的人们现在应该对我们的道德行为或源自道德价值观的行为承担责任。

例如，我们强烈建议我们的任何应用程序开发人员，使用这些技术创建应用程序的任何机构，使它们对最终用户非常透明，因为这是认知应用程序，计算机和计算机。例如，不要假装自己是真实的人。不要假装不要让这个东西假装。

不要模仿

不要模仿它，也不要让您的客户误以为这东西是真实的人。从伦理上讲，这是错误的。我认为这会带来漏洞的风险。与人互动的人可以对我们的缺陷，我们无法实际保留大量信息做出某些假设，在处理认知系统时，我们需要注意提供认知的人解决方案对我们提供的信息的隐私和保护负责。我们不应永远忘记这一事实。

在技术方面，您每天使用什么技术才能激发奇迹？是什么改变了你的生活？

我认为我现在可以访问信息，即使我可以在Internet上获得信息，但很长一段时间以来，我们在Internet上都可以使用我们提供的信息，但有时我们会停止尝试获取该信息，因为这是压倒性的。我当时在看一些相机设备，只是想就不同相机之间的权衡做出决定，

我会向您发送指向我们的买家指南的链接。

妳去它变得不堪重负，但是您必须依靠其他人为您提供建议，并假设他们已经为您完成了研究，但是即使如此，他们仍基于他们对某些事情做出的一些假设而这样做。您需要和关心的内容。在某个时候，您只是简单地放弃，然后说：“好的，告诉我该怎么做，我会做。” 或者，您访问了很多网站，您会看到所有这些意见，但它们却变得混乱和矛盾，于是您说：“嗯，所有这些都令人讨厌。我只想谈谈对我来说很有益的事情。 ”

现在，由于这些系统可以累积，吸收和组织大量信息，即使对于正在提出建议的人员，甚至对于顾问，它都对他们有利，因为它可以帮助他们做得更好。我想说的一种方式是，它不会为我们做任何思考，而是为我们做研究，因此我们可以做得更好，对于我们作为最终用户来说这是事实，对于顾问来说也是如此。担任分析员的任何人都是如此。

我想到了这个应用程序，因为我们一直在努力帮助人们做出购买决定。我们的系统不远，它可以查看您过去五年中拍摄的所有照片，看到您喜欢进行野生动植物摄影或花朵特写，然后根据所拍摄的照片推荐相机你拿。

那就对了。火烈鸟。我不知道为什么

这是为火烈鸟拍照的最佳相机。

火烈鸟，对。

我们快到了。该技术存在，但尚未进行编程。

是的

或教导，就像我们这几天所做的那样。 Rob High，非常感谢您这样做。

非常感谢你。

有关Dan Dan的更多快速转发，请订阅播客。在iOS上，下载Apple的Podcasts应用，搜索“快进”并订阅。在Android上，通过Google Play下载Podcasts的Stitcher Radio应用。