家新闻与分析什么是机器学习？

什么是机器学习？

2024

2017年12月，谷歌于2014年收购的研究实验室DeepMind推出了人工智能程序AlphaZero，该程序可能会在多个棋盘游戏中击败世界冠军。

有趣的是，AlphaZero从人类那里收到了关于如何玩游戏的零指导（因此得名）。相反，它使用了机器学习，这是AI的一个分支，它通过经验而不是显式命令来发展其行为。

在24小时内，AlphaZero在国际象棋中获得了超人的表现，并击败了之前的世界冠军象棋程序。不久之后，AlphaZero的机器学习算法还掌握了Shogi（日本象棋）和中国棋盘游戏Go，并以100比0击败了其前身AlphaGo。

机器学习在最近几年变得很流行，并且正在帮助计算机解决以前被认为是人类智能的专有领域的问题。即使与人工智能的原始愿景相去甚远，机器学习也使我们更加接近创建思维机器的最终目标。

人工智能和机器学习之间有什么区别？

开发人工智能的传统方法涉及对定义AI代理行为的所有规则和知识进行精心编码。在创建基于规则的AI时，开发人员必须编写说明以指定AI应如何应对每种可能的情况。这种基于规则的方法，也称为良好的老式AI（GOFAI）或象征性AI，它试图模仿人类大脑的推理和知识表示功能。

象征性AI的一个完美例子是Stockfish，它是十多年来一直处于领先地位的顶级开源国际象棋引擎。成百上千的程序员和国际象棋棋手为Stockfish做出了贡献，并通过编写规则来帮助开发其逻辑，例如，当对手将其骑士从B1转移到C3时，AI应该怎么做。

但是，在处理规则过于复杂和隐含的情况时，基于规则的AI通常会中断。例如，识别图像中的语音和对象是无法用逻辑规则表达的高级操作。

与符号AI相反，机器学习AI模型不是通过编写规则而是通过收集示例来开发的。例如，要创建一个基于机器学习的国际象棋引擎，开发人员将创建一个基本算法，然后使用数千种以前玩过的国际象棋游戏中的数据对它进行“训练”。通过分析数据，人工智能可以找到定义获胜策略的常见模式，并可以用来击败真正的对手。

AI审查的游戏越多，则预测比赛中获胜动作的能力就越强。这就是为什么将机器学习定义为程序的性能会随着经验的提高而提高的原因。

机器学习适用于许多现实世界的任务，包括图像分类，语音识别，内容推荐，欺诈检测和自然语言处理。

有监督和无监督学习

根据他们要解决的问题，开发人员准备相关数据以构建其机器学习模型。例如，如果他们想使用机器学习来检测欺诈性银行交易，则开发人员将编译现有交易的列表，并用其结果（欺诈性或有效）进行标记。当他们将数据提供给算法时，它将欺诈性交易和有效交易分开，并在两个类别的每个类别中找到共同的特征。用带注释的数据训练模型的过程称为“监督学习”，是当前机器学习的主要形式。

已经存在许多用于不同任务的带标签数据在线存储库。一些流行的示例是ImageNet（一个包含1400万个标签图像的开源数据集）和MNIST（一个具有60, 000个标签手写数字的数据集）。机器学习开发人员还使用诸如Amazon的Mechanical Turk之类的平台，这是一个在线按需招聘中心，用于执行认知任务，例如标记图像和音频样本。越来越多的新兴公司专门从事数据注释。

但是，并非所有问题都需要标记数据。某些机器学习问题可以通过“无监督学习”解决，在这种情况下，您可以为AI模型提供原始数据，并让其自己找出哪些模式是相关的。

无监督学习的常见用途是异常检测。例如，机器学习算法可以训练与Internet连接的设备（例如，智能冰箱）的原始网络流量数据。训练后，AI会为设备建立基线，并可以标记异常行为。如果设备感染了恶意软件并开始与恶意服务器进行通信，则机器学习模型将能够检测到该设备，因为网络流量与培训期间观察到的正常行为不同。

强化学习

到目前为止，您可能已经知道，高质量的训练数据在机器学习模型的效率中起着巨大的作用。但是强化学习是机器学习的一种特殊类型，其中AI在不使用先前数据的情况下发展其行为。

强化学习模型从一开始就开始。仅根据环境的基本规则和手头的任务对他们进行指导。通过反复试验，他们学会优化自己的行动以实现其目标。

DeepMind的AlphaZero是强化学习的有趣示例。与必须看到人类如何下棋并向他们学习的其他机器学习模型相反，AlphaZero开始只知道棋子的动作和游戏的获胜条件。此后，它与自己进行了数百万场比赛，从随机动作开始，逐渐发展为行为模式。

强化学习是研究的热点。它是用于开发可以掌握诸如Dota 2和StarCraft 2之类的复杂游戏的AI模型的主要技术，还可以用于解决现实生活中的问题，例如管理数据中心资源和创建可以处理类似人的灵巧物体的机器人手。

深度学习

深度学习是机器学习的另一个流行子集。它使用人工神经网络和大致受人脑生物学结构启发的软件构造。

神经网络擅长处理非结构化数据，例如图像，视频，音频和长篇摘录，例如文章和研究论文。在进行深度学习之前，机器学习专家必须付出很多努力才能从图像和视频中提取特征，并在此基础上运行其算法。神经网络无需人工就可以自动检测这些功能。

深度学习是许多现代AI技术的背后，例如无人驾驶汽车，高级翻译系统和iPhone X中的面部识别技术。

机器学习的局限性

人们经常将机器学习与人类水平的人工智能相混淆，并且一些公司的市场部门有意地互换使用这些术语。但是，尽管机器学习在解决复杂问题上取得了长足的进步，但距离创建AI先锋所设想的思维机器还很遥远。

除了从经验中学习之外，真正的智能还需要推理，常识和抽象思维，而在这些领域中，机器学习模型的表现非常差。

例如，虽然机器学习擅长于复杂的模式识别任务（例如提前五年预测乳腺癌），但它却遇到了更简单的逻辑和推理任务（例如解决高中数学问题）的问题。

机器学习缺乏推理能力，这使其在推广其知识方面表现不佳。例如，可以像专业人士一样玩Super Mario 3的机器学习代理不会控制其他平台游戏，例如Mega Man，甚至是其他版本的Super Mario。需要从头开始进行培训。

由于无法从经验中提取概念知识，因此机器学习模型需要大量的训练数据才能执行。不幸的是，许多领域缺乏足够的培训数据，或者没有资金来获取更多。深度学习现在是机器学习的一种普遍形式，它也存在一个可解释性问题：神经网络以复杂的方式工作，甚至其创建者都难以遵循其决策过程。这使得在有法律要求解释AI决策的环境中难以使用神经网络的功能。

幸运的是，人们正在努力克服机器学习的局限性。一个明显的例子是国防部研究部门DARPA广泛发起的一项举措，以创建可解释的AI模型。