机器学习算法

机器学习包括回归、分类和聚类等任务。回归用于预测连续数据,如股价趋势分析;分类涉及将数据分为预定义类别,如垃圾邮件检测;聚类则是在无标签数据中找寻自然群体,如学生成绩分组。有监督学习用于回归和分类,而聚类属于无监督学习。
摘要由CSDN通过智能技术生成

机器学习擅长的任务:

● 回归(regression)

● 分类(classification)

● 聚类(clustering)

1.回归(regression)

回归是处理连续数据时使用的方法,如时间序列数据。

股价就是时间序列数据的一个例子,身高和体重本身就是连续的数据,假如记录下每天的身高和体重,那么得到的数据就是类似于股价的时间序列数据了。

从这样的数据中学习它的趋势,求出“明天的股价会变为多少”“今后的趋势会怎样”的方法就是回归算法。当然了,股价的变动不只受过去股价的影响,所以光靠这个信息并不能很好地预测出来。


2.分类(classification)

鉴别垃圾邮件就可以归类为分类问题,即把问题分为不同的类别。

 实际上机器学习中最麻烦的地方,就是收集数据,像以上垃圾邮件分类这张表,需要先用〇或×手动标记邮件是否为垃圾邮件;无论收集数据的环境变得多好,还是有很多需要人工介入的工作。

再比如,根据照片上的人脸来判断他是男人还是女人的工作也是分类问题,像这种只有两个类别的问题称为二分类,有三个及以上的问题称为多分类,比如数字的识别就属于多分类问题。

3.聚类(clustering)

聚类与分类相似,却又有些不同:它与分类的区别在于数据带不带标签。也有人把标签称为正确答案数据。

如上表,聚类算法考虑的问题是:假设在有100名学生的学校进行摸底考试,根据考试成绩把100名学生分为几组,根据分组结果,我们能得出某组偏重理科、某组偏重文科这样有意义的结论

总结:使用有标签的数据进行的学习称为有监督学习,与之相反,使用没有标签的数据进行的学习称为无监督学习。回归和分类是有监督学习,而聚类是无监督学习。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值