Introduction to Machine Learning (一)

  • 算法与机器学习:都是为了在计算机上解决问题
    • 算法:我们已经知道如何解决问题的方法。比如,对于排序而言,我们可以有快排,冒泡等算法。当我们输入一串数的时候,经过不同的算法处理,最终都能输出有序列表。
    • 机器学习:对于有些任务,我们并不知道应该如何处理。列如:我们没有将正常邮件与垃圾邮件分开的算法。因此,我们不知道怎么把输入转化为有效的输出。于是,我们便希望机器自动地为这一任务提取算法。我们不能保证这个算法完全适用,但我们能够构造一个好的并且有用的近似。这一过程,就是机器学习的过程。
  • 机器学习的必要条件
    • 数据:我们缺乏知识(算法),但是我们有海量的实例数据。这些海量的实例数据,在某种程度上而言一定是有一定的规律性的,于是,我们可以分析这个数据,将其转换为可以利用的信息。
  • 监督学习的应用实例
    • 学习关联性
      • 购物篮分析:发现顾客所购商品之间的关联性,如果顾客在购买商品X时也通常购买商品Y,但一名顾客购买X的时候没有购买Y,则这名顾客就是Y商品的潜在用户。就跟平时逛淘宝一样,本来手还在,看着看着手就剁了。购物篮分析不仅仅只用于商品的销售,也可以用于页面提前的加载等各个方面。
    • 分类
      • 信用评分:机器学习系统用一个模型来拟合过去的数据,以便能够对新的申请计算风险,从而决定接受或者拒绝该项申请。这里有两个类,低风险客户和高风险客户。客户信息作为分类器的输入,分类器的任务是讲输入指派到其中的一个类。
      • 模式识别
      • 人脸识别
      • 医学诊断
      • 语音识别
      • 知识抽取
      • 。。。。
    • 回归
      • 预测二手车价格:该系统的输入是我们认为会影响到车价的属性信息:品牌,车龄,发动机性能以及其他信息。输出是车的价格,这种输出为数值的问题就是回归问题。
      • 对移动机器人的导航
      • 。。。
    • 回归问题和分类问题都为监督学习问题,即它有最终的目标,学习从输入到输出的映射关系,其中输出的正确值已经由指导者提供。
  • 无监督学习

    • 聚类:发现输入数据的簇或分组。
      • 图像压缩
        • 输入实例:由RGB值表示的图像像素。
        • 处理:聚类程序将颜色近似的像素点分到相同的分组。
      • 文档聚类
      • 生物信息学
    • 无监督学习的目标是发现输入数据中的规律。
  • 增强学习

    • 某些应用中,系统的输出是动作的序列。即不存在中间状态中最好动作这个概念。机器学习程序就应当能够评估策略的好坏程度,并从以往的动作序列中学习,以便能够产生策略。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值