机器学习的定义
定义1:
机器学习是这样的领域,它赋予计算机学习的能力,(这种学习能力)不是通过显著式编程获得的
显著式编程:需要人为地根据周围的环境、规则、经验等给计算机规定一些机械化步骤或判断依据
非显著式编程:让计算机自己总结规律的编程方法
机器学习的分类
监督学习
1、按训练数据是否存在标签
1)传统的监督学习
2)非监督学习
3)半监督学习
2、按标签是连续还是离散
1)分类
2)回归
强化学习
机器学习算法的过程
机器学习第一步:
特征提取:通过训练样本获得对机器学习有帮助的的多维度数据。
机器学习的重点:在已经提取好特征的前提下,如何构造算法获得更好的性能
提取好的特征——获得好的性能
提取的特征很差——不可能获得好的性能
课程不重点研究特征提取(不同媒质,不同任务,提取特征的方式千变万化),内容太多,机器学习课程缩小研究范围:
我们假设已经获得特征的前提下,研究合理的算法,使学习系统获得较好的性能
没有免费午餐定理
任何一个预测函数,如果在一些训练样本上表现好,那么必然在另一些训练样本上表现不好,如果不对数据在特征空间的先验分布有一定的假设,那么表现好和表现不好的概率一样多。
机器学习本质:通过有限的已知样本数据,在复杂的高维特征空间中预测未知样本的属性和类别。