一 人工智能三大概念
1.人工智能(Arificial Intelligence)概念
用计算机模拟或替代人的大脑。(AI的期望就是像人一样的系统)
2.机器学习(Machine Leaning)概念
即根据已知数据训练模型预测未知数据。(机器自动学习,不基于规则编程)
3.深度学习(Deep Learning)概念
也叫深度神经网络,大脑仿生。
4.关系
机器学习是实现人工智能的一种途径,深度学习是机器学习的一种。
5.算法的学习方式
基于规则的学习和基于模型的学习
二 机器学习的应用领域和发展史
1.机器学习的应用领域
计算机视觉CV:对人看到的东西进行理解
自然语言处理:对人交流的东西进行理解
数据挖掘和数据分析:也属于人工智能的范畴
2.AI发展三要素
数据(输入算法),算法,算力(支撑算法)
CPU:主要适合I/O密集型的任务
GPU:主要适合计算密集型的任务
TPU:专门针对大型网络训练而设计的一款处理器
三 机器学习常用术语
样本:一行数据就是一个样本;多个样本组成数据集;又是一条样本也被叫做一条记录。
特征:一列数据一个特征,有时也被称为属性。
标签/目标:模型要预测的那一列数据。
注:特征是从数据中抽取出来的对结果预测有用的信息。
数据集可划分为:训练集和测试集(比例:8:2,7:3)
训练集:用来训练模型的数据集
测试集:用来测试模型的数据集
四 机器学习算法分类
1.机器算法按照学习方式分类:监督学习,无监督学习,半监督学习,强化学习
2.监督学习:
定义:输入数据是由输入特征值和目标值所组成的,即输入的训练数据有标签的
数据集:需要标注数据的标签/目标值
分类问题目标值是不连续的,回归问题目标值是连续的。
2.无监督学习:
定义:输入数据没有被标记,即样本数据类别未知,没有标签,根据样本间的相似性,对样本集聚类,以发现事物内部结构及相互关系。
无目标值
3.半监督学习:
训练集同时包含有目标值的样本数据和不含有目标值的样本数据
4.强化学习:
智能体不断与环境进行交互,通过获取最大奖励的方式(试错的方式)来获得最佳策略。主要包含四个要素:Agent(智能体),环境(Environment),行动(Action),奖励(Reward)
五 机器学习建模流程
1.获取数据
搜集与完成机器学习任务相关的数据集
2.数据基本处理
数据集中异常值,缺失值的处理等
3.特征工程
对数据特征进行提取,转成向量,让模型达到最好的效果
4.机器学习(模型训练)
根据不同的任务来选中不同的算法,有监督学习,无监督学习,半监督学习,强化学习
5.模型评估
评估效果好上线服务,评估效果不好则重复上述步骤