Introduction to Machine Learning (一)

最新推荐文章于 2019-06-10 16:54:59 发布

1world0x00

最新推荐文章于 2019-06-10 16:54:59 发布

阅读量584

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/u012759870/article/details/49849021

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

算法与机器学习：都是为了在计算机上解决问题
- 算法：我们已经知道如何解决问题的方法。比如，对于排序而言，我们可以有快排，冒泡等算法。当我们输入一串数的时候，经过不同的算法处理，最终都能输出有序列表。
- 机器学习：对于有些任务，我们并不知道应该如何处理。列如：我们没有将正常邮件与垃圾邮件分开的算法。因此，我们不知道怎么把输入转化为有效的输出。于是，我们便希望机器自动地为这一任务提取算法。我们不能保证这个算法完全适用，但我们能够构造一个好的并且有用的近似。这一过程，就是机器学习的过程。
机器学习的必要条件
- 数据：我们缺乏知识(算法)，但是我们有海量的实例数据。这些海量的实例数据，在某种程度上而言一定是有一定的规律性的，于是，我们可以分析这个数据，将其转换为可以利用的信息。
监督学习的应用实例
- 学习关联性
  - 购物篮分析：发现顾客所购商品之间的关联性，如果顾客在购买商品X时也通常购买商品Y，但一名顾客购买X的时候没有购买Y，则这名顾客就是Y商品的潜在用户。就跟平时逛淘宝一样，本来手还在，看着看着手就剁了。购物篮分析不仅仅只用于商品的销售，也可以用于页面提前的加载等各个方面。
- 分类
  - 信用评分：机器学习系统用一个模型来拟合过去的数据，以便能够对新的申请计算风险，从而决定接受或者拒绝该项申请。这里有两个类，低风险客户和高风险客户。客户信息作为分类器的输入，分类器的任务是讲输入指派到其中的一个类。
  - 模式识别
  - 人脸识别
  - 医学诊断
  - 语音识别
  - 知识抽取
  - 。。。。
- 回归
  - 预测二手车价格：该系统的输入是我们认为会影响到车价的属性信息：品牌，车龄，发动机性能以及其他信息。输出是车的价格，这种输出为数值的问题就是回归问题。
  - 对移动机器人的导航
  - 。。。
- 回归问题和分类问题都为监督学习问题，即它有最终的目标，学习从输入到输出的映射关系，其中输出的正确值已经由指导者提供。
无监督学习
- 聚类：发现输入数据的簇或分组。
  - 图像压缩
    - 输入实例：由RGB值表示的图像像素。
    - 处理：聚类程序将颜色近似的像素点分到相同的分组。
  - 文档聚类
  - 生物信息学
- 无监督学习的目标是发现输入数据中的规律。
增强学习
- 某些应用中，系统的输出是动作的序列。即不存在中间状态中最好动作这个概念。机器学习程序就应当能够评估策略的好坏程度，并从以往的动作序列中学习，以便能够产生策略。