welocme to ml(我的吴恩达学习笔记)

一,what is ml:

1:在进行特定编程的情况下,给与计算机学习能力的领域。这是较老的,不正式的定义 –Arthur Samuel

2:一个程序被认为可以从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P的评判,程序在处理任务T时性能有所提升 –Tom Mitchell

目前存在几种不同类型的机器学习算法,主要的为监督学习(Supervised learnnig)和无监督学习(Unsupervised learnnig),此外还有强化学习(Reinforcement learnnig)和推荐系统(Recommender systems)

监督学习(Supervised learnnig):我们将教计算机如何去完成任务

无监督学习(Unsupervised learnnig):我们打算让它自己进行学习

二 ,监督学习(Supervised learnnig):

1,导引:预测房价,收集数据集,其中一个数据集如图,若想买一个70英尺的房子

这里写图片描述
这里写图片描述

2,定义:给出一个算法,需要部分数据集已有正确答案。比如给定房价数据集里面每个数据,算法都知道对应的正确房价,算法的结果为算出跟多正确的房价

更准确的定义:监督学习又叫回归问题,意为预测一个连续值的输出,而术语回归意为预测这类连续值属性的种类

eg:房价(一般把房价记为美分单位,所以实际为离散值,但通常把它看作在实数轴上连续的一个标量,一个连续值的数)

eg2:医学记录,并预测胸部肿瘤为良性或者恶性的概率,假设有人发现了一个乳腺瘤,这个瘤就是一个收集好的数据集,假设在其中,横轴表示肿瘤的大小,纵轴圈上0或1,即是与否
这里写图片描述

这其实是一个分类问题,何为分类,分类就是要预测一个离散值的输出,在这个例子中就是0 or 1

补充:

在分类问题中,还有另外一种方式来描绘数据。如果肿瘤大小作为唯一属性被用于预测恶性良性,可以将数据图作成,使用不同符号表示良性恶性,所以改用符号,圆圈是良,叉是恶,要做的就是将上面的映射下来,图为
这里写图片描述

在此例中只使用了一个特征(属性),即肿瘤块大小。在实际问题中通常会有多个特征(属性)

实际研究中,使用了其它更多的特征,如肿块的厚度,瘤细胞的尺寸的均匀向,相撞的均匀性等等

这表明了有趣的学习算法可以处理无穷多特征,不止5,6个特征,那么你要如何处理无穷多特征存储无数数据(后边的支持向量机)

监督学习中心思想:在监督学习中,数据集中的每个例子,算法将预测得到每个例子的“正确答案”

回归问题:回归是指我们的目标是预测一个连续的输出值

分类:分类是要预测一个离散值输出

习题:判断是分类问题还是回归问题,答案在最后

1,有1000件货物,想预测可以卖多少

2,判断1000个人里面感冒的人

三,无监督学习(Unsupervised learnnig)

1,引例:在上面的例子中,数据集每个样本给出正确答案,如肿瘤的正样本和负样本,而在无监督学习中数据集看起来有些不一样,没有属性(特征)或者标签在一概念,即所有数据都一样,无区别

,也就是给定一个数据集,让你来找出其中的某种结构。

2,定义:对于给定的数据集,无监督学习算法可以判断该数据集包含几种不同聚类,这就是聚类算法。聚类算法在生活中的应用很多,百度搜索出的东西。大型计算机集群,社交网络,对市场细分的方式等等

3,请下载octave,本系列中将要使用octave作为学习工具

使用octave作为学习开发的原型工具很爽的哦嘿嘿

4,习题判断属于无监督,还是监督:

请你回答,糖尿病病人诊断,百度查询的新闻,给一个城市某商品销售数据后的划分市场区域,邮件的判断

———————————-可爱的分割线——————————————

回归 ,分类 ,监督,无,无,监督

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值