1-1 Welcome
机器学习:计算机的新技能
- 1) database mining (数据挖据)
自动化、网络来的大型数据集,包括网络点击数据、医疗记录、生物、工程
- 2) 应用程序无法自己做的事情
自主直升机、手写识别、自然语言处理(NLP)、计算机视觉
- 3) 自定的程序(根据用户习惯推荐)
亚马逊购物建议
- 4) 理解真正的人类学习
大脑、真正的AI
1-2 What is Machine Learning
1959, Arthur Samuel : 让计算机无须编程,即可自主的学习
1998, Tom Mitchell : 计算机程序从经验E中学习任务T, 并使用度量P来衡量性能,条件是他由P定义的关于T的性能随着经验E的增多而提高。
2.学习算法分类
监督学习 和 非监督学习(计算机自我学习)
增强学习和 推荐系统
3.监督学习
给算法一个数据集,并且给定正确答案。算法本身为了给出更多的正确答案
数据集中的每个例子,算法将预测得到例子的“正确答案”
分类问题:预测离散的输出值
回归问题:预测连续的输出值
4.非监督学习
1). 聚类 clustering
组织计算集群,社交网络分析,市场分割,天文数据分析
2). svd:奇异值分解(singular val