机器学习-1 初步认识机器学习、监督学习和非监督学习

一直对机器学习大数据方面的技术感兴趣,平时也在持续关注相关信息。但是,经过很长一段时间之后,发现,这种碎片化的学习只能停留在浅尝辄止,知道、听说过和了解的基础上,很难对技术有一个系统化的认识、全面而深入的学习,痛定思痛,计划使用三个月的时间,对机器学习进行系统化的学习,以期达到融会贯通等目的。在这里,也欢迎感兴趣的同学一起学习,将每天的学习内容分享,一来可以督促坚持,二来可以相互分享,共同进步。另外,我自己创建了一个公众号:数据之下(文章末尾有二维码),也会将每天的学习内容通过公众号分享给大家,也欢迎大家投稿。

今天主要分享一下机器学习的概念,以及两个重要的分支:监督学习和非监督学习的知识。

1、机器学习

首先给大家看一下两个定义的概念,第一种是一个非正式的Arthur Samuel给出的概念: "the field of study that gives computers the ability to learn without being explicitly programmed."  第二种是现在比较流行的Tom Mitchell  给出的概念:"A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E." 。

机器学习有两种主要的分类,监督学习和非监督学习

2、监督学习

在监督学习中,我们会获取一个数据集合,并且,我们大概可以确定正确的输出应该是什么,也就是说,输入和输出是有一定关系的。

根据输出的结果,监督学习被分为两大类:回归和分类。

回归问题:一组输入值,获取的输出结果是连续的值。例如,给定一个城市的历史数据集,根据这些数据集,预测一个城市的房价,预测的房价就是连续值。

分类问题:一组输入值,获取的输出结果是离散的值。例如,给定一个数据集,这个数据集包括肿瘤患者的肿瘤大小、厚度等属性,预测该患者的肿瘤是良性还是恶性,结果只有两种,是1良性,2恶性,这是离散值。

3、非监督学习

在非监督学习中,我们可以在很少或者根本不知道我们的输出结果是什么的时候,就可以从数据中得到结构,我们可以基于数据之间的关系,对数据进行聚类,从而获取这种目标结构。在监督学习中,没有基于预测结果的反馈。             

数据之下公众号二维码:



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值