定义
非显著式编程
规定行为和收益函数,让计算机自己去寻找最大化收益函数的行为
最优化
任务T,经验E,性能指标P
机器学习的分类
把告诉计算机每一个训练样本是什么的过程叫做为训练数据打标签
监督学习
经验E由人工收集
- 基于训练数据是否需要标签
- 传统的监督学习:每一个训练数据都有对应的标签
- 支持向量机
- 人工神经网络
- 深度神经网络
- 非监督学习:所有的训练数据都没有对应的标签
- 聚类
- EM算法
- 主成分分析
- 半监督学习:训练数据中一部分有标签,一部分没有标签
- 传统的监督学习:每一个训练数据都有对应的标签
- 基于标签的固有属性
- 分类:标签是离散的值
- 回归:标签是连续的值
强化学习
经验E由计算机与环境互动
机器学习算法的过程
通过特征提取和特征选择,用不同的算法对特征空间做不同的划分,会得到不同的结果
特征提取
特征:通过训练样本获得的,对机器学习任务有帮助的多维度数据
机器学习的重点是假设在已经提取好特征的前提下,如何构造算法获得更好的性能
不同媒质不同任务,提取特征的方式千变万化
特征选择
没有免费午餐定理
如果不对特征空间的先验分布有假设,则所有算法的表现都是一样的
机器学习的本质
用有限的已知数据在复杂的高维特征空间中预测未知的样本