机器学习是使计算机无需显式编程即可学习的行为。 这是通过将数据提供给计算机并将其转换为决策模型,然后将其用于未来的预测来完成的。
在本教程中,我们将讨论机器学习以及开始机器学习所需的一些基本概念。 我们还将设计一些Python示例来预测某些元素或事件。
机器学习导论
机器学习是一种旨在从经验中学习的技术。 例如,作为一个人,您可以通过观察其他人下棋来学习如何下棋。 以相同的方式,通过为计算机提供从中学习的数据,然后能够预测未来的要素或条件来对计算机进行编程。
例如,假设您要编写一个程序,该程序可以判断某种类型的水果是橙色还是柠檬。 您可能会发现编写这样的程序很容易,并且会给出所需的结果,但是您可能还会发现该程序对于大型数据集无法有效运行。 这就是机器学习发挥作用的地方。
机器学习涉及多个步骤:
- 资料收集
- 数据过滤
- 数据分析
- 算法训练
- 算法测试
- 使用算法进行未来预测
机器学习使用不同种类的算法来查找模式,这些算法分为两类:
- 监督学习
- 无监督学习
监督学习
监督学习是训练计算机通过提供样本数据来识别元素的科学。 然后,计算机从中学习,并能够根据学习到的数据预测未来的数据集。
例如,您可以训练计算机以根据过去的信息过滤掉垃圾邮件。
监督学习已在许多应用程序(例如Facebook)中使用,以基于特定描述搜索图像。 现在,您可以使用描述照片内容的文字在Facebook上搜索图像。 由于该社交网站已经具有字幕图像的数据库,因此它能够以某种程度的准确性搜索描述并将其与照片中的特征进行匹配。
监督学习仅涉及两个步骤:
- 训练
- 测试
一些监督学习算法包括:
- 决策树
- 支持向量机
- 朴素的贝叶斯
- k最近邻居
- 线性回归
例
我们将编写一个简单的程序来演示使用Sklearn库和Python语言进行监督学习的方式。 Sklearn是适用于Python编程语言的机器学习库,具有多种功能,例如多重分析,回归和聚类算法。 <