商业 机器学习业务指南

机器学习业务指南

目录:

视频: 太平吕氏文化ä¸å¿ƒ (十一月 2024)

视频: 太平吕氏文化ä¸å¿ƒ (十一月 2024)
Anonim

从自然语言处理(NLP)到深度学习及其他领域,机器学习(ML)已进入最受欢迎的业务技术的许多方面。 机器学习只是人工智能(AI)革命中的一个因素,但它是一个重要的因素。 机器学习算法是至关重要的情报层,已嵌入到我们使用的产品中,并且将来我们只会看到它渗透到更多的用例中。

机器学习算法嵌入在我们每天使用的许多技术的结构中。 涵盖计算机视觉,深度学习,NLP等领域的ML创新是围绕实用AI进行的一场大规模革命的一部分。 它们不是自主的机器人或众生,而是集成到我们的应用程序,软件和云服务中的一种智能,将人工智能算法和大数据结合在了地下。

这种趋势在企业中更加明显。 ML不再仅用于由数据科学家团队进行的专门研究项目。 企业现在利用ML从不断增长的数据量中获得可行的商业智能(BI)和预测分析。 这就是为什么不仅要知道ML是什么,而且要学习如何将其用于有形价值的最有效策略,比以往任何时候都更加重要。

Ted Dunning博士是MapR的首席应用程序架构师,该架构师为企业提供大数据分发和数据管理工具,并且还合着了两本他称之为“实用机器学习”的书。 这位硅谷资深人士已经在该领域工作了数十年,观察了AI技术和空间的发展,以至于认知计算的进步和开放源代码工具的可用性确实将ML推向了主流。 Dunning与PCMag进行了交谈,以突破行话,解释ML的真正含义,并就如何充分利用ML投资提供一些智慧和最佳实践。

实际定义

ML的直截了当的定义是,无需任何显式编程即可使系统采取行动,反复学习和进行调整的能力。 Dunning说ML是统计的一个分支,但非常实用。 他强调,在现实世界的业务环境中,您需要在应用方式上务实和现实。 ML的核心任务是创建可重复,可靠且可执行的业务流程。

邓宁说:“机器学习并不是要回顾科学数据并试图决定哪些结论是可行的。” “这是关于向前看,并询问我们对未来有什么预测以及在各种情况下会发生什么。当涉及到使用这些数据开展业务时,我们所谈论的是非常有限的情况,需要复制。”

图片提供:Futurism.com的Todd Jaquith。 单击以展开完整的图表。

深度学习与廉价学习

您可以将该基本概念分解为ML中的多个不同领域,但Dunning特别指出了频谱的两端的两个方面:深度学习和他所谓的“廉价学习”。 深度学习是更复杂的概念。

Dunning说:“我们希望机器学习更深入。这就是该术语的由来。” “在过去的10或15年中,已经开发出了能够真正做到这一点的技术。过去需要大量的工程工作才能使数据中的关系对算法可见,但长期以来,这种关系并不像我们这么聪明。您必须将这些可口的数据算法处理在盘子上,因此我们过去常常对系统现在自行完成的所有这些功能进行手工编码。”

深度学习是神经网络众多创新的基础。 它将计算机视觉和NLP等复杂技术结合到“深度”学习层中,从而在图像和文本识别等领域取得了长足的进步。 这对于复杂的建模非常有用,但是对于更简单的日常业务使用(可能依赖于已建立的ML框架和具有更少参数的技术)而言,这可能是过大的选择。

邓宁解释说,廉价学习意味着简单,有效,经过实践检验的技术,企业无需投资昂贵的资源来重新发明轮子。

他解释说:“在计算方面,我们谈论了很多悬而未决的事情。数据的可用性和计算能力的大幅度提高意味着我们已经降低了整棵树。” “简单的机器学习已不再仅适用于数据科学家。”

廉价学习如何工作?

基本的ML算法可以识别相关性并提出建议,或者使体验更符合上下文和个性化。 邓宁说,在我们与计算机进行交互的各个方面,几乎每个方面都有机会让他们使用廉价的学习方法来使事情变得更好。

实践中廉价学习的一个例子是欺诈检测。 银行和商人都在处理普遍存在的欺诈行为,但欺诈行为经常分散存在,并且涉及的价值太低而没有得到报告。 Dunning解释说,通过使用廉价学习算法(即针对该特定任务编程的现有ML测试),商家可以更轻松地识别出让用户面临风险的常见折衷点,并发现其他情况下不会出现的欺诈模式可见。

Dunning表示:“假设您要查找哪些商家似乎正在泄漏导致欺诈的数据。您可以使用G 2检验来简单地找出哪些商家在欺诈受害者与没有欺诈的消费者之间的交易记录中所占比例过高。”说过。 “这似乎太简单了,不能称之为机器学习,但是它会在现实生活中发现坏人。这种技术的扩展可以用来增强一些更高级的技术,从而使简单的学习算法在失败的情况下能够成功。”

廉价学习可以以各种不同的方式使用,因此Dunning给出了另一个示例,说明在线业务可能如何使用它。 在这种情况下,他解释了现有的ML算法如何解决简单的评论排名问题。

“假设您有一篇文章,上面有很多评论。应该按照什么顺序排列它们?如何根据人们的兴趣来对评论进行排序?您可以计算人们阅读评论的次数,以及如何他们多次投票赞成,但仍然需要一点魔术。”邓宁说。

他解释说:“从一位读者那里获得一票赞成票实际上并不比在十位读者中获得八票赞成票更好。” “更糟糕的是,如果您将早期的获胜者放在首位,那么其他评论永远不会成为现实,因此您永远也不会了解它们。一小部分名为Thompson采样的机器学习可以解决这一问题,并在新评论中收集数据以及排名不确定的地方,但通常以给用户最佳体验的方式对其进行排序。”

Dunning还针对如何充分利用ML提出了一系列最佳实践。 有关物流,数据以及各种算法和工具的库如何影响成功的业务战略的细分,请查看我们的7个机器学习成功秘诀。

2018年及以后:现在的ML

也许这不足为奇,但是至少可以说,大数据和关联的数据库空间正在迅速增长。 在圣何塞举行的BigData SV 2018大会上,技术分析公司Wikibon Research首席研究员Peter Burris提出研究结果,表明全球大数据行业的收入估计将从2017年的350亿美元增长到2018年的420亿美元。最重要的是,Burris预测,到2027年,收入将达到1030亿美元。

为了有效地处理所有这些数据,智能ML解决方案将变得比现在更加必要。 很明显,在可预见的将来,机器学习将继续成为热门话题。 一年前,当我们上一次与MapR的Dunning对话时,他强调对商业ML采用一种经过计算的,切合实际的方法。 但是当您谈论技术时,是漫长的一年。 我们最近遇到了Dunning,据他说,自从上次对话以来,情况一直保持不变。 邓宁说:“在较高的水平上,并没有太大改变。” “根据证据推理的基本思想当然不是去年的新闻,但其中的一些工具已经改变。”

考虑到这一点,邓宁还表示,该领域的玩家比一年前更多,但事实并不一定是一件好事。 他解释说:“发生的一件事是,越来越多的供应商开始谈论'神奇的'机器学习,并在其上面加上一个讨厌的词。” “存在很大的误解,认为您可以将数据放入产品中并从中获得一些美好的见解。”

  • 为什么机器学习是未来为什么机器学习是未来
  • Comet.ml想要改变我们与机器学习的互动方式Comet.ml想要改变我们与机器学习的互动方式
  • Google通过SQL简化了机器学习Google通过SQL简化了机器学习

Dunning认为,期望ML产生神奇的结果可能会“使人难以承受”。 他说:“您仍然必须考虑实际存在的问题。您仍然必须收集数据,还必须管理系统的部署。” “而这些务实,后勤的现实仍然主导着这个问题。”

某些软件公司提供的一些崇高的营销手段使Dunning产生了问题。 他说:“没有一种神奇的AI技术甚至可以解决这个问题。” 他为企业提供了一些建议。 据他介绍,确保良好实践的一种方法是聘请特定的AI业务分析师,以便让公司中的某人确定可以使用ML技术改进的业务方面。

Dunning解释说:“在某些情况下,这可能会将您的业务扩展到新的机会。” 但是,在大多数情况下,他强调说,雇用某人了解您组织的需求并使用该信息指导您的机器学习策略至关重要。

机器学习业务指南