- 算法与机器学习:都是为了在计算机上解决问题
- 算法:我们已经知道如何解决问题的方法。比如,对于排序而言,我们可以有快排,冒泡等算法。当我们输入一串数的时候,经过不同的算法处理,最终都能输出有序列表。
- 机器学习:对于有些任务,我们并不知道应该如何处理。列如:我们没有将正常邮件与垃圾邮件分开的算法。因此,我们不知道怎么把输入转化为有效的输出。于是,我们便希望机器自动地为这一任务提取算法。我们不能保证这个算法完全适用,但我们能够构造一个好的并且有用的近似。这一过程,就是机器学习的过程。
- 机器学习的必要条件
- 数据:我们缺乏知识(算法),但是我们有海量的实例数据。这些海量的实例数据,在某种程度上而言一定是有一定的规律性的,于是,我们可以分析这个数据,将其转换为可以利用的信息。
- 监督学习的应用实例
- 学习关联性
- 购物篮分析:发现顾客所购商品之间的关联性,如果顾客在购买商品X时也通常购买商品Y,但一名顾客购买X的时候没有购买Y,则这名顾客就是Y商品的潜在用户。就跟平时逛淘宝一样,本来手还在,看着看着手就剁了。购物篮分析不仅仅只用于商品的销售,也可以用于页面提前的加载等各个方面。
- 分类
- 信用评分:机器学习系统用一个模型来拟合过去的数据,以便能够对新的申请计算风险,从而决定接受或者拒绝该项申请。这里有两个类,低风险客户和高风险客户。客户信息作为分类器的输入,分类器的任务是讲输入指派到其中的一个类。
- 模式识别
- 人脸识别
- 医学诊断
- 语音识别
- 知识抽取
- 。。。。
- 回归
- 预测二手车价格:该系统的输入是我们认为会影响到车价的属性信息:品牌,车龄,发动机性能以及其他信息。输出是车的价格,这种输出为数值的问题就是回归问题。
- 对移动机器人的导航
- 。。。
- 回归问题和分类问题都为监督学习问题,即它有最终的目标,学习从输入到输出的映射关系,其中输出的正确值已经由指导者提供。
- 学习关联性
无监督学习
- 聚类:发现输入数据的簇或分组。
- 图像压缩
- 输入实例:由RGB值表示的图像像素。
- 处理:聚类程序将颜色近似的像素点分到相同的分组。
- 文档聚类
- 生物信息学
- 图像压缩
- 无监督学习的目标是发现输入数据中的规律。
- 聚类:发现输入数据的簇或分组。
增强学习
- 某些应用中,系统的输出是动作的序列。即不存在中间状态中最好动作这个概念。机器学习程序就应当能够评估策略的好坏程度,并从以往的动作序列中学习,以便能够产生策略。
Introduction to Machine Learning (一)
最新推荐文章于 2019-06-10 16:54:59 发布