人工智能
- 通过机器来模拟人类认知能力的技术;
- 涵盖感知,学习\推理与决策等方面;
- 最核心的能力是根据给定的输入做出判断或预测;
人工智能历史发展
- 1955年,达特茅斯会议标志ai诞生;
- 1957年,第一款神经网络perceptron诞生;
- 1970年,计算能力的突破没有完成大规模数据训练和复杂任务,ai进入低谷;
- 1982年,提出霍普菲尔德网络;
- 1986年,BP算法出现,AI进入第二黄金期;
- 1990年,人工智能计算机DARPA没能实现,ai进入第二次低谷;
- 2006年,Hinton提出深度学习神经网络,人工智能取得突破进展;
- 2013年,深度学习算法在语音和视觉识别上取得成功;
深度学习的崛起和AI的三次热潮
-
第一次热潮:20世纪50年代,神经网络相关理论基础的提出。
-
第二次热潮:20世纪80年代初,算法应用升级;
-
第三次热潮:2006年深度学习基本理论框架得到验证,深度学习技术崛起。
人工智能发展的基石:
- 图灵测试
人工智能三大核心要素
- 数据
- 算法
- 算力
算法
- 关于怎么做的一系列指令叫做算法
-
传统算法:遍历法
-
更聪明的算法:梯度下降法
-
更复杂的算法:机器学习
算力的突破-传统CPU与新兴运算加速技术
-
CPU
-
只有几个CPU同时计算
-
其他的负责控制,负责缓存
-
运算速度不如GPU
-
-
GPU
-
多个GPU同时计算
-
成倍提升计算能力
-
-
FPGA
-
软件控制硬件
-
降低了开发风险
-
-
分布式运算
-
每台电脑按任务及规则计算各自的工作
-
把每台电脑计算的结果汇总
-
人工智能关系
机器学习概述
- 一种实现人工智能的方法;
- 是一门多领域交叉学科;
- 涉及概率论,统计学,逼近论,凸分析,算法复杂度等;
- 是人工智能的核心;
- 是计算机具有智能的根本途径;
- 应用遍及各个领域;
- 主要使用归纳\综合而不是演绎;
深度学习概述
- 一种实现机器学习的技术:
- 利用深度神经网络;
- 将模型处理的更为复杂;
- 使模型对数据的理解更加深入;
- 是机器学习中基于对数据表征学习的方法;
- 动机在于建立模拟人脑进行学习分析的神经网络;
- 模仿人脑的机制来解释数据;
- 通过构建具有很多隐藏层的学习模型和海量数据;
- 学习更有用的特征;
- 最终提升分类或预测的准确性;
人工神经网络概述
- 一种机器学习的算法;
- 一般有输入层->隐藏层->输出层;
- 隐藏层数量多于2个的网络称为深度神经网络;
机器学习
- 人工智能是通过机器来模拟人类认知能力的技术;
传统人工智能方法
-
逻辑推理
-
专家系统(基于人工定义的规则来回答问题);
当代的人工智能
- 普遍通过学习来获得进行预测和判断的能力:机器学习。
什么是机器学习
个人观点:新的预测也应对模型权重有所反馈,因为人就是在不断的学习过程中逐步提高我们的认知水平,不应该把机器的学习割裂为训练和预测,都是学习的过程。
决策树模型
- 机器学习是计算机利用已有的数据,得出某种模型,并利用此模型来预测的一种方法。
生物神经网络
感知器
- 外部刺激通过神经末梢;
- 转化为电信号;
- 转导大神经细胞(神经元)
- 无数神经元构成神经中枢;
- 神经中枢综合各种信号,做出判断;
- 人体根据神经中枢指令;
- 对外部刺激做出反应;
人工神经网络
人造神经元
- 输入:x1,x2,x3;
- 输出:output
- 简化模型:约定每种输入只有两种可能1或0;
- 所有输入都是1;
- 表示各种条件都成立;
- 输出为1;
- 所有输入都是0;
- 表示条件都不成立;
- 输出为0;
神经网络的架构
什么是深度学习?
-
传统的神经网络发展到了多层隐藏的情况
-
具有多个隐藏层的神经网络称为深度神经网络
-
基于深度神经网络的机器学习称为深度学习。
人工智能可以做什么?
-
计算机视觉
-
语音识别
-
自然语言
计算机视觉典型技术
- 人脸检测\追踪\识别\属性分析
- 行人\车辆检测\追踪\识别\属性分析
- 文字检测和识别
- 物体检测和识别
计算机视觉典型应用
- 人脸身份认证;
- 智能交通;
- 机器人视觉(无人机)
- 图像搜索引擎
- 图像和视频理解;
- 图像和视频美化;
语音识别典型技术
- 语音识别;
- 声纹识别;
- 多麦克风阵列系统;
语音识别典型应用
- 语音输入
- 语音控制
- 智能助手
- 机器翻译
- 机器人听觉
自然语言典型技术
- 词句嵌入
- 语义模型
自然语言典型应用
- 聊天机器人
- 智能助手
- 智能客服
- 视频理解
- 机器翻译
人工智能最热方向
-
计算机视觉
-
智能驾驶
-
机器人
-
智慧医疗
-
自然语言处理
-
Ai芯片
-
智慧金融
-
AI开放平台
-
生物识别
-
AI大数据
计算机视觉(computer Vision)
-
对图像中的客观对象构建明确而有意义的描述
-
从一个或多个数字图像中计算三维世界的特征
-
基于感知图像做出对客观对象和场景的有用的决策
- 一句话:让计算机拥有人能所见,人能所识、人能所思的能力,就是计算机视觉
基于深度学习的计算机视觉
计算机视觉的应用
- 图像分类
- 目标检测
- 目标跟踪
- 语义分割
- 实例分割
图像分类
-
图像分类架构:卷积神经网络CNN
ReLU
RELU f(x)=max(0,x)
池化层-pool
目标检测
-
R-CNN
语以分割
-
FCN
实例分割
-
Mask R-CNN
计算机视觉应用领域
-
安防
-
交通
-
工业生产
-
在线购物
-
信息检索
-
游戏娱乐
-
摄影摄像
-
机器人/无人机
-
体育
-
医疗