机器学习中各种模型适用的数据集

最新推荐文章于 2022-11-14 18:58:41 发布

白果的爹

最新推荐文章于 2022-11-14 18:58:41 发布

阅读量2.9k

点赞数 1

本文链接：https://blog.csdn.net/Ychendong/article/details/80105725

版权

机器学习有几种经典的算法，回归，分类，聚类还有时间序列算法。每种算法种类中又有各自不同的模型。

有监督学习（Supervised learning）
有监督学习（Supervised learning）通过大量已知的输入和输出想配对的数据，让计算机从中学习出规律，从而能针对一个新的输入做出合理的输出预测。比如，我们有大量不同特征（面积、地理位置、朝向、开发商等）的房子的价格数据，通过学习这些数据，预测一个已知特征的房子价格，这种称为回归学习（Regression learning），即输出结果是一个具体的数值，它的预测模型是一个连续的函数。再比如我们有大量的邮件，每个邮件都已经标记是否是垃圾邮件。通过学习这些已标记的邮件数据，最后的得出一个模型，这个模型对新的邮件，能准确地判断出该邮件是否是垃圾邮件，这种称为分类学习（Classfication learning），即输出结果是离散的，即要么输出1表示是垃圾邮件，要么输出0表示不是垃圾邮件。

无监督学习（Unsupervised learning）
无监督学习（Unsupervised learning）通过学习大量的无标记数据，去分析出数据本身的内在特点和结构。比如，我们有大量的用户购物的历史记录信息，从数据中去分析用户不同的类别。针对这个问题，我们最终能划分几个类别？每个类别有哪些特点？我们事先是不知道的。这个称为聚类（Clustering）。这里需要特别注意和监督学习里的分类的区别，分类问题是我们知道了有哪几种类别：而聚类问题，是我们在分析数据之前其实是不知道有哪些类别的。即分类问题是在已知答案里选择一个，而聚类问题的答案是未知的，需要利用算法从数据里挖掘出数据的特点和结构。

白果的爹

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
机器学习中各种模型适用的数据集

机器学习有几种经典的算法，回归，分类，聚类还有时间序列算法。每种算法种类中又有各自不同的模型。有监督学习（Supervised learning）有监督学习（Supervised learning）通过大量已知的输入和输出想配对的数据，让计算机从中学习出规律，从而能针对一个新的输入做出合理的输出预测。比如，我们有大量不同特征（面积、地理位置、朝向、开发商等）的房子的价格数据，通过学习这些数据...
复制链接

扫一扫