机器学习（一）线性模型

最新推荐文章于 2022-02-13 17:26:38 发布

荒野13

最新推荐文章于 2022-02-13 17:26:38 发布

阅读量565

点赞数

本文链接：https://blog.csdn.net/lovejay7/article/details/79576110

版权

什么是机器学习？

机器学习是一门致力于研究如何通过计算的手段，利用经验来改善系统自身的性能。在计算机系统中“经验”通常以“数据”形式存在，因此机器学习研究的内容是关于从数据中产生模型的算法，有了这些算法，我们把数据提供给它，它就能基于数据产生模型，在面对新的情况时，模型会给我们提供相应的判断。什么是学习？赫尔伯特西蒙曾给出如下定义：“如果一个系统能够通过执行某个过程改进它的性能，这就是学习”

机器学习组成

主要任务
- 分类：将实例数据划分到合适的类别中。
- 回归：主要用于预测数值型数据。

学习方式
- 监督学习
必须确定目标变量的值，以便机器学习算法可以发现特征和目标变量之间的关系。 (包括：分类和回归)
样本集：训练数据 + 测试数据
训练样本 = 特征(feature) + 目标变量(label: 分类-离散值/回归-连续值)
特征通常是训练样本集的列，它们是独立测量得到的。
目标变量: 目标变量是机器学习预测算法的测试结果。
在分类算法中目标变量的类型通常是标称型(如：真与假)，而在回归算法中通常是连续型(如：1~100)。
- 非监督学习
数据没有类别信息，也不会给定目标值。
聚类：在无监督学习中，将数据集分成由类似的对象组成多个类的过程称为聚类。
密度估计：将寻找描述数据统计值的过程称之为密度估计。
此外，无监督学习还可以减少数据特征的维度，以便我们可以使用二维或三维图形更加直观地展示数据信息。