机器学习算法

最新推荐文章于 2024-11-01 16:54:23 发布

bboysky45

最新推荐文章于 2024-11-01 16:54:23 发布

阅读量576

点赞数

分类专栏：机器学习文章标签：机器学习算法 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_18668137/article/details/130867128

版权

机器学习专栏收录该内容

14 篇文章 0 订阅

订阅专栏

机器学习包括回归、分类和聚类等任务。回归用于预测连续数据，如股价趋势分析；分类涉及将数据分为预定义类别，如垃圾邮件检测；聚类则是在无标签数据中找寻自然群体，如学生成绩分组。有监督学习用于回归和分类，而聚类属于无监督学习。

摘要由CSDN通过智能技术生成

机器学习擅长的任务:

● 回归（regression）

● 分类（classification）

● 聚类（clustering）

1.回归（regression）

回归是处理连续数据时使用的方法，如时间序列数据。

股价就是时间序列数据的一个例子，身高和体重本身就是连续的数据，假如记录下每天的身高和体重，那么得到的数据就是类似于股价的时间序列数据了。

从这样的数据中学习它的趋势，求出“明天的股价会变为多少”“今后的趋势会怎样”的方法就是回归算法。当然了，股价的变动不只受过去股价的影响，所以光靠这个信息并不能很好地预测出来。

2.分类（classification）

鉴别垃圾邮件就可以归类为分类问题，即把问题分为不同的类别。

实际上机器学习中最麻烦的地方，就是收集数据，像以上垃圾邮件分类这张表，需要先用〇或×手动标记邮件是否为垃圾邮件；无论收集数据的环境变得多好，还是有很多需要人工介入的工作。

再比如，根据照片上的人脸来判断他是男人还是女人的工作也是分类问题，像这种只有两个类别的问题称为二分类，有三个及以上的问题称为多分类，比如数字的识别就属于多分类问题。

3.聚类（clustering）

聚类与分类相似，却又有些不同：它与分类的区别在于数据带不带标签。也有人把标签称为正确答案数据。

如上表，聚类算法考虑的问题是：假设在有100名学生的学校进行摸底考试，根据考试成绩把100名学生分为几组，根据分组结果，我们能得出某组偏重理科、某组偏重文科这样有意义的结论。

总结：使用有标签的数据进行的学习称为有监督学习，与之相反，使用没有标签的数据进行的学习称为无监督学习。回归和分类是有监督学习，而聚类是无监督学习。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。