1.机器学习的定义
Arthur Samuel(1959)
Filed of study that gives computers the ability to learn without being explicity programmed
Tom Mitchell(1998)
A computer program is said to learn from experience E with respect to some task T and some performance measure P,if its performance on T,as measured by P,improves with experience E.
2.机器学习
- Database mining (数据挖掘)
- Large datasets from growth of automation/web.
- Applications can’t program by hand
- Autonomous helicopter, handwriting recognition, most of Natural Language Processing (NLP), Computer Vision.
1.工具
- Octave
- Matlab
3.监督式学习
- Supervised Learning
- “right answers” given
- 由上图可以看出根据统计而来的数据,可以拟合成相应的曲线,预测连续的数据输出。
1.分类问题
- Classfication
- 处理问题是离散的,而非连续
- Discrete valued output(0 or 1)
- malignant —恶性的
- benign —良性的
- 考虑多个输入变量和多个特性
- 根据一个算法预测一个新的病人他的肿瘤是良性的还是恶性的
- 现实中还需要考虑多种因素,比如肿块厚度,细胞大小的一致性,形状…
- 无限维的时候,支持向量机可以处理无限种特性
4.非监督性学习
- Unsupervised Learning
1.聚类算法
- 图像处理,计算机视觉
- 3D的建立
- 应用
- 1.计算机集群组织 —organize computing clusters
- 2.社会网络分析—social network analysis
- 3.市场划分 — market segmentation
- 4.航天数据分析
- 鸡尾酒会问题
- 提取声音
- 独立组件分析
- 文本处理,理解功能分级,机械数据…
- 电磁大脑,扫描的EEG数据
- ICA algorithm
- 用C或者java可能很惨,但是matlab就是几行代码
5.强化学习
- Reinforcement Learning
- 回报函数
- 你想要什么?如何定义一个好的行为或者坏行为?
- 直接编写控制器程序很困难
- 学习型算法能够很好的解决机器人问题,解决直接编写控制器程序困难的问题