机器学习起步

对于任何一个object都有可以描述他的特征,比如一个人的特征有身高、体重、肤色、血型、性别等,从这些特征中可以选择出一些标签来对这个object进行分类,还是以人这个class来举例,若用血型来做标签,就可以将人分为A、B、C、D型等血型的人,若可以用一个方程 F 来表述特征与标签的关系,即 F( weight, height … ) -> label , 很明显这个工作就是分类,通过已有数据—测试数据,求得这个函数F,然后将新产生的数据应用到这个F上得到新数据的分类,函数F对新数据的分类结果与实时分类结果的之间误差即为泛化误差。
上面例子中的特征的取值是离散的,还有一类object 的特征是连续的,这时分类就不适用了,这种场景下的任务称为回归任务。

用测试数据选好的模型,可能会不是很理想地拟合现实数据,这里分为不能很好的掌握训练数据的特性和能充分掌握训练数据的特性,但是对模型复杂度较高两种情况,前者称为欠拟合,后者称为过拟合。这两种情况都是不合适的。学习的过程就是为了找到较好学习到训练数据的特征,又不会过拟合的模型。

上面的例子中数据都是有标签的,但是对于事先没有打好标签的数据,可否用数据的特征通过某个模型M来对这些数据惊醒分类呢,当然是可以的,这个建模的过程叫做无监督学习,可以看作一种“数据自己介绍自己”的过程,主要任务包括聚类和降维降维是为了用更简洁的方式表现数据,聚类则是为了将数据组合成不同的类别
监督学习方法主要有k-means。
总结:

  1. 机器学习通常是用数据产生模型的算法,主要包括监督、分监督和半监督学习以及增强学习。
  2. 监督学习是对有标签的数据学习,进而产生能掌握数据特征的模型。非监督学习是对数据学习后产生能将测试数据分类的模型。

机器学习规划todo

  • 监督学习
    knn
    决策树
    线性回归
    逻辑回归

  • 无监督学习
    PCA降维
    k-means

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值