人工智能的两大任务——预测和决策
预测包括对输入目标的模式识别、标签分类、回归、预测未来数据、聚类
决策需要机器产生行动,改变状态,如下围棋、自动驾驶
支持人工智能的四大类技术
搜索——结合算法探索分支的好坏,从而做出决策,如下棋
推理——基于给定的知识归纳出规律完成证明、知识问答
学习——通过经验数据对目标优化的自动化过程,如人脸识别
博弈——多个人工智能体的交互,如足球配合
可以这样子说“学习是系统基于数据来提升既定指标分数的过程”
机器学习的三大类——监督学习、无监督学习、强化学习
监督学习:数据实例有(x,y)即特征x和标签y,根据特征来预测标签,由损失函数来定义性能指标。如人脸识别,关注这个人脸图像是否准确预测对应的身份
无监督学习:没有标签y了,主要关注数据的分布,包含的模式。如关注人脸图像的分布,判断这个图像是否包含人脸
强化学习:关注人工智能的决策问题,寻找更好的决策过程
机器学习模型的泛化能力是什么呢?
泛化能力:描述一个只能模型在没有见过的数据上的预测能力,用泛化误差来衡量模型的泛化能力,也就是说机器学习模型见过很多数据,对于新的数据也可以预测,就是因为经验丰富,见过很多数据的底气!这个叫做统计泛化能力
机器学习的模型天赋
也就是说面对不同的任务需要选择较为准确的模型来做,怎么选择模型呢,就要看机器学习模型的特点,也叫归纳偏置,字面大概意思就是说他们的归纳的一个偏好。也就是是模型对问题的假设是这样子的,如果你的数据也是这样子,那这个模型很适合。
ps:如果归纳偏置更强的模型可以更好的发现数据的模式。
神经网络对同分布领域的数据归纳偏置高,所以在处理图像和语音很适合,但是树模型对混合离散的数据偏置高,就很适合做风险预测什么的。
机器学习的限制
数据限制,数据量可能很难满足
泛化能力的限制:可能统计泛化能力不太完全满足需要,需要组合泛化能力
使用形态限制:因为我们现在主要的是通过输入数据训练模型,输出训练好的模型