在本周的节目中,我与GumGum的首席执行官兼创始人Ophir Tanz坐了下来,该公司最初是一家计算机视觉公司,并迅速成为一家全栈垂直AI解决方案公司。 我们谈到了当前的人工智能繁荣及其改变涉及的每项业务的潜力。 GumGum当前在广告中提供各种AI驱动的解决方案,并且才刚刚起步。
GumGum的核心是一家计算机视觉公司。 我们以多种方式表达该技术。 我们最大的业务部门是我们的广告部门,我们发明了一种广告格式,称为“图片内广告”,目前,我们与70%的财富100强品牌以及世界上许多最大的发布商合作。 我们要做的是根据市场环境将营销消息与用户积极参与的内容保持一致。 在这种情况下,我们将识别图像的上下文,并根据其实际调整营销信息。
您的网站上有许多示例。 这个真的很酷。 我认为大多数人都不知道这是在他们实际遇到网站时看到的。 他们认为可能是这样编写的,但是实际上您是在拍摄照片的内容,然后投放基于照片的广告,不一定是网站甚至是文章。
正确。 这个想法是用户访问网站,而照片通常是给定网页的英雄单元。 如果您看任何眼动追踪研究,您会发现大部分热量都集中在照片周围。 这个想法是创建一个非常原生的放置,但也要正确显示它。 它往往具有相对的影响力,并且具有非常好的特征,因为我们不需要填补每个库存机会。
我们能够做的是在适当的时候随时在与该用户相关的情况下加载广告。 这也具有产生更好的用户体验的巨大效果,因为您很少看到我们的广告,但是当您这样做时,它们的影响力就更大。 在许多情况下,它还具有授权发布者从其属性中删除其他标准格式并将房地产归还给那些发布者站点以用于内容的权力。
在我所看到的研究中,并不是人们讨厌广告。 他们讨厌音量。
是。
他们讨厌音量,讨厌侵入,讨厌弹出窗口。 只要不影响体验,看到广告实际上并不会打扰他们。
我认为这是当今行业中一个非常大的问题。 如果您查看传统的IAB广告格式,则会遇到很多问题。 一个是他们需要100%的时间加载,因此无论如何,广告都在加载。 您显然有与此相关的巨大可见性问题。 加载网页后,该网页上的100%IAB广告将加载,您可能只向下滚动三分之一。 广告商为这些印象付费,但从未被人看到。 他们没有创造任何价值。 我认为,这实际上相当于我们上次进行计算时,每年仅燃烧10或120亿美元,其中包括烟。
那是个大问题。 仅当相关内容进入浏览器时,我们才会加载格式。 几乎没有浪费的印象。 我确实相信,广告的未来,尤其是当您转向平板电脑和手机等不同设备时,将会是一种更加集成和更具选择性的体验。 广告的想法是向用户传达一条消息,使人们从中获利,从而使他们可以在许多情况下继续提供免费内容。 我们的观点是“让我们看到广告。让我们非常受人尊敬,但让我们很少展示它”,我们认为最终对所有相关利益攸关方都更好。
让我们谈谈您经营的体育部门。这是一种非常有趣的方法,可以用来打开库存并使用计算机视觉进行操作,而如果您是手工或人工操作,这是不切实际的。
好吧,在过去的几十年中,手工和人工完成的方式都是如此。 这是一个容易出错的方法,因为通常会发生10分钟或数小时的游戏时间。 您会将其运送到通常在海外的地方。 您将让人们从字面上手动标记那些赞助商的出现位置以及每次曝光的相对质量。 然后,他们在黑盒中将其推断为总体价值。
因此,有人在看录像带,在场外标志上标识可口可乐徽标,然后说出观看了多长时间,几秒钟。
是的,以及该视频的质量。 被迷惑了吗? 模糊吗? 有多大? 像那样的东西。 我们所做的实际上是采用了实际上相同的方法,但是我们都是使用计算机视觉以编程方式进行的。 这是该技术的一种非常优雅的实现,因为我们能够全面地看待事物。 我们查看每个视频,每个精彩视频,每个社交图像的每一刻,确定所有这些曝光在哪里出现,以及这些曝光的质量。 然后,我们使所有相关利益相关者(在这种情况下,包括权利所有者和品牌)
赞助是一项大生意。 在这些事情上花了很多钱,而且要进行适当的收费才能进行很多谈判。 这省去了很多猜测工作。
我想想洋基体育场的WB Mason标志。 它在外场中,如果您去玩游戏,就会看到它,但这是必须量化并具有一定附加值的东西,并且您的工具可以帮助创建和确定该价值。
是的 我们甚至在帮助权利人重新定位摄像机的角度并进行此类操作,以最大程度地提高赞助商曝光度。 社交是在GumGum之前从未真正以全面的方式加以考虑的元素。 事实证明,从赞助角度来看,社交媒体上产生的大部分价值都发生在拥有和经营的财产上。
如果不使用计算机视觉,就不可能看待整个社会并真正确定所有这些风险所在。 我们已经能够在所创造的实际价值中展现出巨大的提升,而且人们越来越多地交流自己的经验,因此与电视相关的价值也在不断上升。
同时为这两个应用程序提供支持的东西实际上是计算机视觉。 它具有的算法可以识别图像中的内容,视频图像中的内容,然后对其进行识别,将其放入框中并进行分类。 那确实是您建立公司的核心技术。
是。
去哪儿了 您已经拥有了这两个应用程序。 接下来是什么?
正如您在介绍中提到的那样,我们是一家全栈垂直AI解决方案公司,这意味着最终我们拥有了这一非常强大的技术。 就将其实际应用于世界上的实际用例而言,它是相对较新的。 当我们看世界时,我们看到大量可以真正从此功能中受益的行业。 在这一点上,几乎没有人真正受益于该功能。
如果您查看与实施这些解决方案相关的选项,您将拥有基于云的解决方案,那么您将拥有Watson和Google云愿景以及Amazon之类的东西。 问题在于,为了真正解决实际的业务需求,我们认为您既需要内部的业务级别专业知识,也需要拥有专门针对该特定问题构建解决方案的技术知识。 我从未见过要采用基于云的AI解决方案并将其集成到产品中来建立公司或什至是成功的产品。
原因是您没有能力尽可能多地调整这些内容。 至少在今天,开发成功的AI系统确实涉及很多技巧,这更多是错误,而不是功能。 最终,这些东西将变得更加商品化,这是一件好事,我们也正在为此努力。 而且真的很贵 我们为一分钱的零头所做的事情会花掉您40到100美元之间的费用,而这些云计算公司的CPM则为50美分。 使用这些解决方案大规模地做任何事情实际上是不可行的。
现在,在某些情况下,您可以在云端之外利用某些类型的AI,例如自然语言处理和一些文本分析。 但实际上仅限于这些区域。 在那里,我们看到了销售发挥着重要作用,这是我们确实拥有的,从技术角度来看的专业知识,并且我们能够集成业务级别的专业知识,从而可以构建完整的解决方案。 到目前为止,我们在体育领域有广告,我们有一个社会部门,我们正在寻找许多其他机会。
我听说过使用IBM Watson进行投诉的重要性在于您拥有该工具,但是,然后,在实际使用它进行任何操作之前,您必须对其进行培训,并且必须知道要对其进行培训。 然后,许多小型企业没有这种技能。 他们需要聘请顾问来培训AI。 您会怎样做呢?
我们都在相同的架构上运行。 如果您使用的是神经网络,那是我认为Watson在今天使用的很大程度上,当然还有我们正在使用的网络。 有一个与此相关的培训元素。 一旦进行了大规模操作,这确实成为方程式算法方面的同等挑战。
必须能够将标记的,可伸缩的,无偏的数据集放在一起。 同样,我将其称为错误而不是功能。 这是我们多年来一直在做的事情,我们可以做得很好。 最终,神经网络的质量将取决于您能够馈送数据的质量,因此并不是我们从中得到了解决。 只是我认为我们现在必须快速获取并标记这些集合,
在我看来,这些大型高科技公司(亚马逊,谷歌,Facebook)的优势之一是它们拥有海量数据集。 它们在计算机科学的历史上确实是无与伦比的,并且随着我们进入人工智能时代,仅访问这些数据集便为它们提供了优势。
这是可持续的优势,还是您认为新贵和较小的公司将能够竞争?
这是一个巨大的优势,因此您的假设是正确的。 看,数据为王,只要这些东西需要用数据训练,那么对于任何应用程序而言,具有最相关数据的实体都处于有利地位。 有趣的是,我们为开源运动做出了巨大贡献。 所有其他公司也是如此。 我们实际上是在共享知识,但是在数据方面的共享却不够。 我们有开放的数据集。 我们也有很多专有数据,大公司当然也有,但是这确实是针对特定问题的。
例如,我们正在做的一件事-这不是核心业务,但我们为社区做的更多-我们正在收集世界上最大的牙科X射线图像集。 例如,如果我们确实想以此为基础开展业务,那谷歌或亚马逊将无法访问。 他们没有理由。 它们具有某种类型的数据。 他们拥有UGC图像,例如UGC视频,大量位置数据,以各种方式提供的许多非常有价值的见解,但是如果您要确定裂缝和管道,或者要优化作物,除尘,这里有无数的应用。 我要说的是,他们在某些方面有好处,而且公司之间会有所不同。
回到牙科数据,您将如何使用庞大的牙科图像数据库?
我们要做的是举办一场全球竞赛,类似于ImageNet,这是斯坦福大学每年举办一次的竞赛,以了解哪个公司可以最准确,最方便地对标签数据集进行排序。 我们想做类似的事情。
实际上,它不仅仅是商业产品,还只是一个分类项目。
今天,是的。
让我们来谈谈一些使人们不安的AI问题-他们认为这是一项将由政府部署的技术。 它将由大公司部署,但这些AI实际上将使个人消费者采取行动,而不是能够自己利用它们。 您认为这是一个公平的假设,还是会在某个时候改变?
我要说是和不是。 您可能会争辩说,正在对个人采取行动,并且个人是其中每一个业务产品(甚至是位智之类的东西)的猎物。
我认为伯尼·桑德斯一直在争论。
但是我认为最终消费者还是最终的最大受益者,因为至少有公司正在尝试开发能够为人们的生活和其他业务增值的产品。 我认为政府有自己的力量…我不知道我应该称它为邪恶的还是仅仅是直接的增值,除非您想从安全的角度来看它。 看,这东西很难做。 完成并不便宜。 换句话说,即使只是获取数据集也要占用资源。 致力于这一工作的大型实体最终将拥有它。
一直出现的另一件事是AI和自动化代理。 以GumGum的体育部门为例,这是通过过去虽然在国外使用的软件来完成的,但是该软件是由人们看着磁带并对其进行分类的。 您如何看待与这些类型的职业有关的失业
这让我很担心。 在GumGum,我已经看到了这种情况。 我们开发了自动化解决方案,该解决方案取代了以前用来标记图像或视频的人员,您可以说这是自动化的代价。 我认为人们经常会为这件事感到非常乐观,例如,“所有新技术都会创造新工作。看看工业革命。” 我只是不赞成这种说法。 我认为并非所有技术都是平等创造的,默认情况下并非所有技术都会创造新的工作。 我确实认为,从这个意义上讲,已经创造了大量的新工作。
例如,可能已经做过标记的人现在可能在为我们标记和标记图像,并且可能是同一个人,但最终,它使我非常担忧。 我认为,从长远来看,这是我们作为一个社会必须解决的问题。 普遍的基本收入在政府一级和其他地方已被详细讨论。 我认为这不是一个坏主意。 我认为这可能是一个很好的主意。
我确实认为,这对社会和个人幸福还有其他影响,我们还没有答案。 我认为这是一个具有挑战性的问题,我希望我们现任政府以及未来的政府会多加注意以尝试发明,并在必要时甚至补贴未来世界,而不是试图带回煤炭工作,其中在美国有70, 000。 这没有多大意义。
他们可能不会回来了。
他们不应该回来。 对环境有害。 对于那些人来说,这不是高质量的生活,也不是长期的可持续解决方案。
好吧。 让我们向听众提问:您认为基本全民收入有多大?
我刚刚给出的答案可能是目前我可以提供的最佳答案。 我认为我们没有足够的数据或足够的洞察力来做类似的事情。 我知道世界上有一些政府正在尝试这些事情。 进行见证并向其学习将是非常有趣的。
我也不认为我们现在处于一个需要建立诸如普遍基本收入制度之类的地方的地方。 我认为这是一个
我认为我们刚刚开始全神贯注于所有这些新技术的后果,因为这些都是相对较新的发展。 看来它的发生速度比工业革命快得多,并且我们将需要内在化在道路上行驶所有这些不同事物的人工智能驱动汽车,自动驾驶汽车和卡车的后果。 一旦到了我们的家,我想我们就可以进行关于如何补偿的现实讨论。
我们公司经常谈论的一件事是这种不断变化的观念,我认为这是我们现在生活的世界的一个基本真理。 如果您从技术意义上看这意味着什么,则意味着您拥有各种以指数曲线形式发展的功能,而我正在谈论的是从像素分辨率到硬盘容量再到处理速度的所有内容,然后您还需要进行软件开发,并且所有这些技术都在这些曲线的不同拐点处出现。 但是,所有这些都在改变,这就是今天实际上使广告成为可能的原因,即有效的GPU和处理速度。 这些算法可以追溯到50年代和60年代。 我认为,第一个神经网络是在50年代开发的。 它有40个神经元。
例如,如果您要以每米一米采取30个线性步长,那么在经过30步之后,您将遍历30米。 我们本来应该穿过这个房间,但是如果您采取30个指数级的步骤,在这种情况下,这只是一个简单的加倍。 一,二,四,八,然后经过30步,您将穿越地球圆周26次-大约十亿米。 尤其有趣的是,大部分增长发生在最后几个步骤中-因此,在第29步,您的身高达到5亿米。
那就是对指数增长的欺骗。 长期以来,它看起来很像线性增长,实际上,它可能会落后于线性增长曲线,而线性增长曲线在每个线性周期中都有较大的增长,但是最终却截然不同。 而且,这使未来变得异常令人兴奋,并在许多方面使之变得神秘而难以预测。 在GumGum,我们尝试着眼于更长的时间范围-诸如AR和VR以及可穿戴设备和物联网之类的东西-但我们也尝试以两年为增量来计划我们的业务,因为我们认为这与就您所看到的,以及您能够确定并建立一个
我认为这是当今世界所面临的挑战。 当然,传统公司正在经历这种情况,这是一种主导力量。 这与数百年来您可以开发业务模型并且可以正常工作之前的情况不同。 变更周期更长,因此您可以长期获得收益。 现在,您必须不断创新并加深对世界的了解,并尝试了解与您的企业相关的各种范式转换,并朝着它们迈进。
相对于正确判断五年后将发生的事情,灵活和能够做出回应可能比有用
这也是为什么您会在所有这些未来技术中看到如此疯狂的投资的原因,因为公司并不愚蠢。 我们在谈论大型公司。 他们知道他们靠的是传统业务。 他们知道事情正在发生巨大变化,他们知道自己需要下大赌注。 我们看到非常大胆,非常大胆的公司押注,因为这是他们的唯一选择,这也是为什么我认为初创公司将继续具有巨大的价值,可加和成功的原因,因为最终,当您处于在停滞时期,无论您是投资还是公司发展,都很难创造新的价值,但是当一切都在变化的时候,创造价值的机会很多。
我认为当您谈论指数思维以及将头缠绕在这些曲线的形状上有多么困难时,您说的很重要。 我从您以前的一次谈话中窃取了您所说的话,到2023年,1, 000美元将为您提供具有人脑计算能力的设备。 它将复制那么多的处理能力。 到2043年,我们大多数人可能还活着,那么您将拥有1000美元的处理能力。 它比地球上的所有大脑都要大。
结合起来,是的。
那是做什么的?
这是非常有趣的一点。 公平地说,我是从雷·库兹韦尔那里偷来的。 他做了分析。
我们都站在巨人的肩膀上。
我不想为此功不可没,但这确实是有启发性的。 再一次,我不认为我们-作为一个社会,作为一个物种-尤其擅长指数式思考。 我们的大脑被构造为线性思考。 最终提供了更大的生存潜力,几千年前在非洲丛林中并没有提供很多好处,对吗?
这样做的含义是巨大的,因为很多事情都可能被强制执行。 您具有算法和技术的质量-并且始终可以变得更优雅-但是,如果您具有足够的处理能力,则可以通过简单地投入更多的计算能力来完成许多不可能实现的事情。 在某些方面,您可能会争辩说神经网络-我敢肯定,我们将回顾一下这项技术,并认为它相当不雅-如果您查看一下它相对于人脑所需的处理能力, ,这是人脑实际行为的较差图像,大脑使用这些机器执行这些计算时所消耗的力量很小。
我认为这证明了未来确实很难预测。 它的变化将比任何人都意识到的要大得多,然后它也确实使人们意识到软件的质量,因为如果我们能够开发足够高质量的软件,那么显然计算能力问题将成为限制因素。 。 如果您想谈论通用AI或超级智能,那么限制因素将是我们开发合适软件的能力,因为显然,如果您可以购买具有与整个人类同等计算能力的芯片, 1, 000美元,那么这可能比您需要的力量多70亿倍。
我们知道有很多行业将要转型。 我们可以说我们将拥有自动驾驶汽车。 也许不是在五年之内,也许不是在十年之内,但是肯定是在20年之内。 您是否认为有一个行业会被我们尚未想到的人工智能所转变,或者为这一转变还没有准备好?
看,这是在其他强大工具,技术,软件,硬件中非常强大的工具。 我想不出一个无法从AI功能集成中受益的行业。 您能够更好地处理数据,处理视频,每个行业都可以从中受益。 这就是为什么我看到能够构建垂直堆栈AI如此强大的原因
我想问你一个问题,我问节目中的所有人。 您最关心什么技术趋势? 有什么可以让您彻夜难眠吗?
武器化的核能或核弹头。
老歌,但好东西。
它只是重新流行。
显然有点担心。 另一方面,您每天使用的技术或工具会激发奇迹吗?
在过去的八个月左右的时间里,我非常热衷于木工,主要是传统的木工。 因此,很多手动飞机和街机飞机,以及辐条刮胡刀。 老实说,我感到很鼓舞。 它们只是非常漂亮的工具,对我来说,很能说明人的创造力。 处理人类发明的非常简单但功能强大且有效的工具真是太好了。
可能有一台由AI驱动的大型自动化机器,也可以执行相同类型的木工处理。
我认为一定程度的艺术性和满足感是构成人类经验的一部分。 看,我实际上也有很多电动工具。 最终,使用手动工具始终可以获得更好的表面质量和更好的产品,但这最终是挑战之一。 显然,如果我们实际上不是地球上最聪明的物种,那将产生深远的影响。
首先,我们可以看看如何处理较少的
我认为这不是指日可待的事情。 我认为,我们有许多突破,无论是从某种形式来呈现,甚至甚至开始看起来都没有自觉的智能,但是无论是40年还是400年,这在人类历史的规模上都是相对的,微不足道的。 值得一提的是这些东西的含义。 没有人在谈论停止开发这些技术。 显然,我们天生就很好奇,这不是一个选择。 我也不认为这是一个选择,但是很可能,我们将在制定正确的协议以应对这些现实情况之前到达那里。
它可以追溯到变化的指数性质。 我们将以比我们准备的速度更快的速度实现某些功能,而且我认为政府,官僚机构甚至当今的企业都没有能力以这种速度来管理变更。 实际上适当地趋向于必要的变更级别将造成一定程度的混乱。
同时,您将在木工车间工作。
你告诉我。 计划B。
您要问什么类型的事情?
凳子,碗,汤匙之类的东西。 现在真的很简单。 我是新手,正在寻找导师。 一直生活在我一直喜欢的位字节的数字空间中,这让我非常高兴,我从小就当程序员,对此一向非常着迷,而且我仍然一如既往地爱着它。 但是,这仅仅是一个对立的问题,它是非常物理性和手动性的,并且您所处理的大部分是木材,这是一个很好的并置。
很有机。 有趣的是,有多少技术专家以出色的编程技能和出色的技巧参加了展览,但他们从中获得乐趣的却往往是那些实际在用手中工作的东西。
是的 回到那种令人高兴的方面。
如果导师现在正在观看,并且他们想与您取得联系,或者他们只是想关注您和GumGum所做的事情,他们如何在线上与您取得联系?
您可以在我们的网站Gumgum.com的Twitter @ ophirtanz,Ophir Tanz的LinkedIn上找到我。 所有类型的方式。
优秀的。 Ophir,非常感谢您来到实验室。
感谢您的款待。
我很感激。
太棒了。
今天是快进。 我要感谢您加入我们。 如果您想查看该节目的前几集,可以在PCMag.com上找到它们。 如果要在iTunes上收听播客,可以在Apple播客上找到,也可以在Android Play上找到。 您可以在免费赠送精美播客的任何地方找到它。 非常感谢您今天加入我们,以后再见。