一、机器学习概念

引言:

1.1 机器学习能做什么?

      谷歌和微软实现了学习算法来排行网页,Facebook或苹果的图片分类程序,电子邮件垃圾邮件筛选器
      机器学习不只是用于人工智能领域,机器人、计算生物学、硅谷中大量的问题,数据库挖掘
      自然语言处理或计算机视觉,这些语言理解或图像理解都是属于AI领域。亚马逊或Netflix或iTunes Genius,其他电影或产品或音乐的建议

1.2 机器学习是什么?

定义:不存在一个被广泛认可的定义,
              Arthur Samuel:在进行特定编程的情况下,给予计算机学习能力的领域(西洋棋)
              Tom Mitchell:一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P评判,程序在处理T时的性能有所提升。
                                      经验E 就是程序自我练习的经验,而任务T就是下棋。性能度量值P 赢得比赛的概率
               两种类型学习算法:监督学习和无监督学习,监督学习:我们将教计算机如何去完成任务,而在无监督学习中,我们打算让它自己进行学习

1.3 监督学习

   **举例1:预测房价**(面积与房价)**   
  监督学习指的就是我们给学习算法一个数据集,由“正确答案”组成,(如面积、房价样本),算出更多的正确答案。回归问题,推测出一个连续值的结果(房价)
   **回归:**试着推测出这一系列连续值属性。
            回归分析是通过规定因变量和自变量来确定变量之间的因果关系,建立回归模型,并根据实测数据来求解模型的各个参数,然后评价回归模型是否能够很好的拟合实测数据;如果能够很好的拟合,则可以根据自变量作进一步预测
             回归分析的主要内容有以下:
           ①从一组数据出发,确定某些变量之间的定量关系式;即建立数学模型并估计未知参数。通常用最小二乘法。
           ②检验这些关系式的可信任程度。
           ③在多个自变量影响一个因变量的关系中,判断自变量的影响是否显著,并将影响显著的选入模型中,剔除不显著的变量。通常用逐步回归、向前回归和向后回归等方法。
           ④利用所求的关系式对某一过程进行预测或控制。
           回归主要的种类有:线性回归、曲线回归、二元logistic回归、多元logistic回
 **举例2:预测肿瘤**(大小与是否良性)**   
      估算出肿瘤是恶性的或是良性的概率。用术语来讲,这是一个**分类**问题。
      怎么处理无限多个特征,甚至怎么存储这些特征都存在问题 **支持向量机**
      监督学习:其基本思想是,我们数据集中的每个样本都有相应的“正确答案”。再根据这些样本作出预测,就像房子和肿瘤的例子中做的那样。我们还介绍了回归问题,即通过回归来推出一个连续的输出,之后我们介绍了分类问题,其目标是推出一组离散的结果。

1.4 无监督学习

监督学习,训练集对应的正确答案
无监督学习算法可能会把这些数据分成两个不同的簇。所以叫做聚类算法
举例:google新闻关联,基因学的理解应用(不同个体基因聚类),组织大型计算机集群(选择机器),社交网络的分析(分组),市场分割(划分顾客),天文数据分析(解释星系诞生)
鸡尾酒宴问题(两个音频的区分)
无监督学习,它是学习策略,交给算法大量的数据,并让算法为我们从数据中找出某种结构

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值