（《机器学习》完整版系列）1-1 机器也学习？-CSDN博客

本文链接：https://blog.csdn.net/qiy_icbc/article/details/129038551

机器也学习？

“机器学习”很火，一天有人问我：“机器也学习？”。如下作一简单的解释并作为周志化《机器学习》辅导系列的开篇。
————————————————————————————————

平时，我们所说的“学习”一词是指人类的学习，“好好学习，天天向上”，打开这个博客看看，你就在学习。

但“机器学习”（machine learning）是怎么回事？

首先，人们希望机器越来越智能，能像人类一样“学习”，这是人类给予未来的一个美好愿望与期待，因此，将这方面的研究冠之以“机器学习”就是再自然不过的事了。

其次，目前“机器学习”还是初级的，与其说是“学习”还不如说是“训练”，即训练机器去完成某项特定的预测任务。例如，【西瓜书】中，“判断西瓜的好坏”就是一个特定的预测任务。用于“学习”的机器也不是通常的机器，而是在机器（计算机）上装有一种特殊的软件，叫“算法”，为区别于其他类型的算法，常称它为“学习算法”（learning algorithm），“学习算法”里的“学习”不是动词，而是动名词，是对算法的类型加以限定。

再次，人类学习有个重要方法，叫“总结经验”。类似，“机器学习”主要是从“经验”中学习。然而，机器中并没有对“经验”的具体地描述，而“经验”体现为一堆“数据”，称为数据集，因此，“机器学习”就是通过“数据”来训练出一个模型，之后就用这个模型去解决指定的问题（即特定任务）。例如，以判断西瓜好坏为目的，我们去观察并切开若干个西瓜，纪录这些西瓜的“数据”，再用这些“数据”去“训练”一个“机器”（含有“学习算法”的计算机），训练出一个“模型”，之后，反复用这个“模型”去来判断西瓜的好坏。

因此，可以这样简单地理解“机器学习”这个词：针对一个预测任务，寻找一个合适的“机器”（即算法），将“数据”（即训练集）输入该“机器”训练出一个模型（确定参数，类比成“学习”），最后将这个模型作为产品投放到应用场景中（用于预测任务）。这个过程流水线分为三大步，对应于“机器学习”涉及的三类角色：一是“算法工程师”，他以研究“算法”为主业，发明新算法、优化旧算法；二是“数据工程师”，他既要从现实中获取“数据”，又要从算法工程师提供的“算法库”中选取合适的算法，有机地结合二者训练出模型，这些工作常需借助机器学习平台来完成；三是用户，他使用数据工程师训练出的模型（产品）去完成预测任务。

综上，“机器学习”与人类学习有天壤之别，英文中用的词为“learn”而不是“study”，也体现了这一点。 “机器学习”已成为一门学科的专有名词，其主要方向是研究“学习算法”及其如何有效地训练，当然，与之相关的内容也在研究之列，如，获取怎样的“数据”、怎样评价结果等等。

机器学习主要应用于人类“可见”的三大领域（图像识别、语音识别和自然语言处理）以及人类“不可见”的其他“识别”领域（如，数据挖掘）¹，并由此派生出许许多多的二级应用场景，如，人脸识别、自动翻译、聊天机器人、业务风险识别、智能推荐、智能医疗、自动驾驶等等。

我已经写了一个系列博客，以周志华的西瓜书为背景材料，为同鞋们提供辅导。
恭喜你进入了这个辅导系列！现在你可以吃着西瓜，开始学习《机器学习》了。
书山有路勤为径，预祝你走向成功。

本文为原创，您可以：