机器学习的定义
机器学习是一种非显著式编程。显著式编程是程序固定了程序的输入输出,但是非显著式编程可以让机器进行不断学习。以机器人路径规划为例,机器人根据经验E来提升性能指标P的过程。
在人脸识别任务中,经验E往往指训练样本以及对应标签的集合。这些输入的数据都是人为手动添加标签,被称为监督学习。在自动驾驶任务中,经验E往往需要计算机和环境互动获得,计算机产生行为,算法定义收益函数,通过改变行为模式来最大化收益函数。这种往往被称为强化学习。
监督学习
-
传统的监督学习(所有的训练数据都有对应的标签)
–支持向量机
–人工神经网络
–深度神经网络 -
非监督学习(所有的训练数据都没有对应的标签)
聚类
EM算法
主成分分析算法 -
半监督学习(少量标记数据和大量未标记数据)
机器学习入门
机器学习的第一步:不是下载大量的数据+套用一个模型!重点在于分析原始数据,对数据有感性的认知!!!
针对不同媒质不同任务,提取特征的方式千变万化。
第一步:特征提取
因此,选择“面积”和“周长”作为选择的特征。
第二步:采用支持向量机划分不同标签的数据
不同的机器学习算法会对特征特征空间做不同的划分,可以获得不同的分类曲线。
在设计机器学习算法的时候有一个假设:在特征空间上距离接近的样本,属于同一个类别的概率会更高。
没有免费的午餐定理:没有普遍而放之四海而皆准的算法。