机器学习起步

最新推荐文章于 2024-05-03 18:58:17 发布

acethan

最新推荐文章于 2024-05-03 18:58:17 发布

阅读量80

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/acethan/article/details/116011151

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

对于任何一个object都有可以描述他的特征，比如一个人的特征有身高、体重、肤色、血型、性别等，从这些特征中可以选择出一些标签来对这个object进行分类，还是以人这个class来举例，若用血型来做标签，就可以将人分为A、B、C、D型等血型的人，若可以用一个方程 F 来表述特征与标签的关系，即 F( weight, height … ) -> label ，很明显这个工作就是分类，通过已有数据—测试数据，求得这个函数F，然后将新产生的数据应用到这个F上得到新数据的分类，函数F对新数据的分类结果与实时分类结果的之间误差即为泛化误差。
上面例子中的特征的取值是离散的，还有一类object 的特征是连续的，这时分类就不适用了，这种场景下的任务称为回归任务。

用测试数据选好的模型，可能会不是很理想地拟合现实数据，这里分为不能很好的掌握训练数据的特性和能充分掌握训练数据的特性，但是对模型复杂度较高两种情况，前者称为欠拟合，后者称为过拟合。这两种情况都是不合适的。学习的过程就是为了找到较好学习到训练数据的特征，又不会过拟合的模型。

上面的例子中数据都是有标签的，但是对于事先没有打好标签的数据，可否用数据的特征通过某个模型M来对这些数据惊醒分类呢，当然是可以的，这个建模的过程叫做无监督学习，可以看作一种“数据自己介绍自己”的过程，主要任务包括聚类和降维。降维是为了用更简洁的方式表现数据，聚类则是为了将数据组合成不同的类别。
监督学习方法主要有k-means。
总结：

机器学习通常是用数据产生模型的算法，主要包括监督、分监督和半监督学习以及增强学习。
监督学习是对有标签的数据学习，进而产生能掌握数据特征的模型。非监督学习是对数据学习后产生能将测试数据分类的模型。

机器学习规划todo

监督学习
knn
决策树
线性回归
逻辑回归
无监督学习
PCA降维
k-means

acethan

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习起步

对于任何一个object都有可以描述他的特征，比如一个人的特征有身高、体重、肤色、血型、性别等，从这些特征中可以选择出一些标签来对这个object进行分类，还是以人这个class来距离，若用血型来做标签，就可以将人分为A、B、C、D型等血型的人，若可以用一个方程 F 来表述特征与标签的关系，即 F( weight, height … ) -> label ，很明显这个工作就是分类，通过已有数据—测试数据，求得这个函数F，然后将新产生的数据应用到这个F上得到新数据的分类，函数F对新数据的分类结果与实时
复制链接

扫一扫