人工智能(一)——机器学习和深度学习介绍
机器学习
多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎么模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它主要使用归纳、综合而不是演绎。
针对经验E和一系列的任务T和一定表现的衡量P,如果随着经验E的积累,针对定义好的任务T可以提高表现P,就说计算机具有学习能力。
机器学习的应用:语音识别、自动驾驶、语言翻译、计算机视觉、推荐系统、无人机、识别垃圾邮件
深度学习
深度学习是基于机器学习延伸出来的一个新的领域,由以人大脑结构为启发的神经网络算法为起源加之模型结构深度的增加发展,并伴随大数据和计算能力的提高而产生的一系列新的算法。
基本概念
训练集、训练样例:用来进行训练,也就是产生模型或者算法的数据集
测试集、测试样例:用来专门进行测试已经学习好的模型或者算法的数据集
特征向量:属性的集合,通常用一个向量来表示,附属于一个实例
分类:目标标记为离散型数据
回归:目标标记为连续性数据
有监督学习:训练集有标记
无监督学习:训练集无标记
半监督学习:有标记的训练集+无标记的训练集
机器学习步骤框架
- 把数据拆分为训练集和测试集
- 用训练集的数据来训练算法
- 用学习来的算法运用到测试集上来评估算法
机器学习中分类和预测算法的评估
- 准确率
- 速度
- 健壮性
- 可规模性
- 可解释性