1.1 人工智能概述
1.人工智能起源
图灵测试 达特茅斯会议
2.人工智能三个阶段
1980年代是正式成型期 1990-2010年代是蓬勃发展期 2012年之后是深度学习期
3.人工智能、机器学习和深度学习
机器学习是人工智能的一个实现途径 深度学习是机器学习的一个方法发展而来
4.主要分支介绍
1.计算机视觉
eg:人脸识别
2.自然语言处理
语音识别 语义识别
3.机器人
5.人工智能必备三要素
数据 算法 算力
6.GPU、CPU
GPU--计算密集型 CPU--IO密集型
1.2 机器学习工作流程
1.定义
数据 自动分析获得模型 预测 从数据中自动分析获得模型,并利用模型对未知数据进行预测
2.工作流程
1.获取数据 2.数据基本处理 3.特征工程 4.机器学习(模型训练) 5.模型评估
3.获取到的数据集介绍
1.专有名词
样本 特征 目标值(标签值) 特征值
2.数据类型构成
类型一:特征值+目标值 目标值分为是离散还是连续 类型二:只有特征值,没有目标值
3.数据分割
训练数据(训练集)--(构建模型) 0.7-0.8 测试数据(测试集)--(评估模型) 0.2-0.3
4.数据基本处理
对数据进行缺失值、去除异常值等处理
5.特征工程
1.定义
把数据转换成为机器更容易识别的数据
2.为什么需要特征工程
数据和特征决定了机器学习的上限,而模型和算法知识必进这个上限而已
3.包含内容
特征提取 特征预处理 特征降维
6.机器学习
选择合适的算法对模型进行训练
7.模型评估
对训练好的模型进行评估
1.3 机器学习算法分类
1.监督学习--有特征值,有目标值
目标值连续--回归 目标值离散--分类
2.无监督学习--仅有特征值
3.半监督学习
有特征值,但是一部分数据有目标值,一部分没有
4.强化学习
动态过程,上一步数据的输出是下一步数据的输入 四要素:agent、action、environment、Reward
1.4 模型评估
1.分类模型评估
准确率 精确率 召回率 F1-score AUC指标
2.回归模型评估
均方根误差RMSE 相对平方误差RSE 平方绝对误差MAE 相对绝对误差RAE 决定系数
3.拟合
欠拟合: 学习的特征太少,导致区分标准太粗糙 过拟合: 所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,导致在验证数据集以及测试数据集中表现不佳