吴教授课程第一次学习

机器学习——吴教授课程

机器学习

机器学习的定义:
(1)在没有明确设置的情况下,使得计算机具有学习能力的研究领域。
(2)计算机程序从经验E中学习解决某一任务T进行某一能量度P,通过P测定在T上的表现因经验E而提高。
举一个例子,比如人与电脑成千上万次的对战西洋棋,在这个事件中任务T就是下西洋棋,而E就是成千上万次的练习,而P就是在进行下一棋局时获胜的概率,P会因为E而提高。
又或者电脑自动处理垃圾邮件,在这个事件中任务T就是自动处理垃圾邮件,E就是你所认定的垃圾邮件,P就是在出现下一封垃圾邮件时电脑判定成功的概率。
两种机器学习方法的大体分类:

  1. 监督学习
  2. 无监督学习

监督学习

监督学习的定义:
给定算法一个数据集,其中包含了正确答案,即在这个数据集中的每个样本,都会有一个对应的正确答案,而算法本身的目的就是利用原先提供的数据集而给出更多的数据预测。

连续性监督学习:
比如给出一组数据,是在某一地区的房子大小和房子价格的数据集,然后现在你在该地区有一间房子想要卖掉,你大概估计一下可以卖多少钱。
在这里插入图片描述
在这个图中红叉代表我们数据集中的原有数据,而我们需要预测750大小的房子大概可以价值多少钱,图中用了两种拟合曲线,不同的方法对应着不同的预测值,这就是连续型的监督学习。

离散型监督学习:
假设说你想通过查看病历来推测乳腺癌良性与否,假如有人检测出乳腺肿瘤,恶性肿瘤有害并且十分危险,而良性的肿瘤危害就没那么大,所以人们显然会很在意这个问题。
在这里插入图片描述
在这个图片中我们的预测值只有两种,1或0对应着是或者不是,而现在就是通过原有数据集进行预测,当给出一个新的肿瘤大小时能否判定出是否为恶性肿瘤。
术语来讲,这是一个分类问题。分类指的是,我们试着推测出离散的输出值:0或1良性或恶性,而事实上在分类问题中,输出可能不止两个值。比如说可能有三种乳腺癌,所以你希望预测离散输出0、1、2、3。0 代表良性,1 表示第1类乳腺癌,2表示第2类癌症,3表示第3类,但这也是分类问题。

无监督学习

无监督学习定义:
只是给定一个数据集,并没有其对应的正确答案,只是将这些数据根据自身的一些特性分成不同的簇。所以叫做聚类算法。
聚类应用的一个例子就是在谷歌新闻中。如果你以前从来没见过它,你可以到这个URL网址news.google.com去看看。谷歌新闻每天都在,收集非常多,非常多的网络的新闻内容。它再将这些新闻分组,组成有关联的新闻。所以谷歌新闻做的就是搜索非常多的新闻事件,自动地把它们聚类到一起。所以,这些新闻事件全是同一主题的,所以显示到一起。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值