课程视频:网易云课堂
课程详细笔记:github
已经有的笔记:https://blog.csdn.net/qq_34611579/article/details/80665546
<我的记录仅是整理自己的学习思路,整理复习之用>
目录:
+ 初识
+ 什么是机器学习
+ 监督学习
+ 无监督学习
一·初识
机器学习
- 是从AI发展出来的一个领域
- 为计算机开发的一项新功能
Example:
- 数据挖掘:网络和自动化技术的发展产生了大量的数据集
例:点击流数据,医疗记录,计算生物学,工程学所有领域
- 我们无法手动编写的程序
例:自动直升机,手写识别,自然语言处理,计算机视觉
- 私人定制程序
例:亚马逊推荐
- 理解人类的学习过程和大脑
二·什么是机器学习
Arthur Samuel定义(1959):在没有明确设置的情况下,使计算机具有学习能力的研究领域。
om Mitchell定义(1998):计算机程序从经验E中学习解决某一任务T进行某一性能度量P,通过P测定在T上的表现因经验E而提高。
例:跳棋游戏:经验E:程序与自己下几万次跳棋
任务T:玩跳棋
性能度量P: 与新对手玩跳棋时赢的概率
机器学习算法:监督学习,无监督学习,强化学习,推荐系统
三·监督学习
例子1:房价预测
1.粗浅:Supervised Learning:" right answers" given
给算法一个数据集,其中包含了正确答案,算法的目的就是给出更多的正确答案。
2.专业:Regression:Predict continuous(回归问题)
预测连续值的属性
例子2:预测乳腺癌恶性还是良性
![](https://i-blog.csdnimg.cn/blog_migrate/091f686bb5a573086dbeaf5d82825cca.png)
![](https://i-blog.csdnimg.cn/blog_migrate/edc5dff2c1b295f7382e74b9ea29ebb7.png)
1.专业:Classification(分类问题)
预测离散值输出
总结:监督学习就是对于数据集中的每个样本(包含正确答案)进行算法预测,得出更多‘正确答案’。回归是预测一个连续值输出,分类是预测离散值输出
四·无监督学习
在无监督学习中,所用的数据没有任何标签或都具有相同标签,寻找其某种结构(上图聚类算法)
例:谷歌新闻,根据给定基因将人群分类,大型计算机集群,社交网络分析,市场细分,天文数据分析,鸡尾酒会问题(一行代码:Octave)。