机器学习经典算法

监督学习

监督学习中的数据集是有标签的,就是说对于给出的样本我们是知道答案的。如果机器学习的目标是通过建模样本的特征x和标签y之间的关系:f(x,theta)或f(y|x,theta),并且训练集中的每个样本中都有标签,成为监督学习。根据标签类型的不同,又可以分为**分类问题和回归问题。**前者是预测某样东西所属的类别,比如给定一个人的身高、年龄、体重等信息,然后判断性别、是否健康等;后者则是预测某个样本所对应的实数输出,比如预测某一地区人的平均身高。常见的监督学习算法有:k-近邻算法、决策树、朴素贝叶斯等。

无监督学习

无监督学习中的数据集是完全没有标签的,依据相似样本在数据空间中一般距离较近这一假设,将样本分类。常见的算法包括:稀疏自编码、K-Means算法等。可以解决关联分析、聚类问题和维度约减。

  • 关联分析是指发现不同事物之间同时出现的概率。
  • 聚类问题是将相似的样本划分为一个簇,与分类问题不同,聚类问题预先并不知道类别,自然训练数据也没有类别的标签。
  • 维度约简是指减少数据维度的同时保证不丢失有意义的信息。利用特征提取方法和特征选择方法,可以达到维度约简的效果。在这里插入图片描述
  • 由上图知道,左图是对一群有标签数据的分类,而右图是对一群无标签数据的聚类。

半监督学习

半监督学习一般针对的问题是数据量大,但是标签数据少或者说标签数据的获取很难很贵的情况,训练的时候有一部分是有标签的,而有一部分是没有的。两种常见的学习方式是直推学习和归纳学习。

<
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值