计算机视觉基础知识(零)--人工智能初步

人工智能

  • 通过机器来模拟人类认知能力的技术;
  • 涵盖感知,学习\推理与决策等方面;
  • 最核心的能力是根据给定的输入做出判断或预测;

人工智能历史发展

  • 1955年,达特茅斯会议标志ai诞生;
  • 1957年,第一款神经网络perceptron诞生;
  • 1970年,计算能力的突破没有完成大规模数据训练和复杂任务,ai进入低谷;
  • 1982年,提出霍普菲尔德网络;
  • 1986年,BP算法出现,AI进入第二黄金期;
  • 1990年,人工智能计算机DARPA没能实现,ai进入第二次低谷;
  • 2006年,Hinton提出深度学习神经网络,人工智能取得突破进展;
  • 2013年,深度学习算法在语音和视觉识别上取得成功;

深度学习的崛起和AI的三次热潮

  1. 第一次热潮:20世纪50年代,神经网络相关理论基础的提出。

  2. 第二次热潮:20世纪80年代初,算法应用升级;

  3. 第三次热潮:2006年深度学习基本理论框架得到验证,深度学习技术崛起。

人工智能发展的基石:

  • 图灵测试

人工智能三大核心要素

  1. 数据
  2. 算法
  3. 算力

算法

  • 关于怎么做的一系列指令叫做算法
  • 传统算法:遍历法

  • 更聪明的算法:梯度下降法

  • 更复杂的算法:机器学习

算力的突破-传统CPU与新兴运算加速技术   

  • CPU

    • 只有几个CPU同时计算

    • 其他的负责控制,负责缓存

    • 运算速度不如GPU

  • GPU

    • 多个GPU同时计算

    • 成倍提升计算能力

  • FPGA

    • 软件控制硬件

    • 降低了开发风险

  • 分布式运算

    • 每台电脑按任务及规则计算各自的工作

    • 把每台电脑计算的结果汇总

人工智能关系

机器学习概述

  • 一种实现人工智能的方法;
  • 是一门多领域交叉学科;
  • 涉及概率论,统计学,逼近论,凸分析,算法复杂度等;
  • 是人工智能的核心;
  • 是计算机具有智能的根本途径;
  • 应用遍及各个领域;
  • 主要使用归纳\综合而不是演绎;

深度学习概述

  • 一种实现机器学习的技术:
  • 利用深度神经网络;
  • 将模型处理的更为复杂;
  • 使模型对数据的理解更加深入;
  • 是机器学习中基于对数据表征学习的方法;
  • 动机在于建立模拟人脑进行学习分析的神经网络;
  • 模仿人脑的机制来解释数据;
  • 通过构建具有很多隐藏层的学习模型和海量数据;
  • 学习更有用的特征;
  • 最终提升分类或预测的准确性;

人工神经网络概述

  • 一种机器学习的算法;
  • 一般有输入层->隐藏层->输出层;
  • 隐藏层数量多于2个的网络称为深度神经网络;

机器学习

  • 人工智能是通过机器来模拟人类认知能力的技术;

传统人工智能方法

  • 逻辑推理

  • 专家系统(基于人工定义的规则来回答问题);

当代的人工智能

  • 普遍通过学习来获得进行预测和判断的能力:机器学习。

什么是机器学习

        个人观点:新的预测也应对模型权重有所反馈,因为人就是在不断的学习过程中逐步提高我们的认知水平,不应该把机器的学习割裂为训练和预测,都是学习的过程。

决策树模型

  • 机器学习是计算机利用已有的数据,得出某种模型,并利用此模型来预测的一种方法。

生物神经网络

感知器

  1. 外部刺激通过神经末梢;
  2. 转化为电信号;
  3. 转导大神经细胞(神经元)
  4. 无数神经元构成神经中枢;
  5. 神经中枢综合各种信号,做出判断;
  6. 人体根据神经中枢指令;
  7. 对外部刺激做出反应;

人工神经网络

人造神经元

  •  输入:x1,x2,x3;
  • 输出:output
  • 简化模型:约定每种输入只有两种可能1或0;
  • 所有输入都是1;
  • 表示各种条件都成立;
  • 输出为1;
  • 所有输入都是0;
  • 表示条件都不成立;
  • 输出为0;

神经网络的架构

什么是深度学习?

  • 传统的神经网络发展到了多层隐藏的情况

  • 具有多个隐藏层的神经网络称为深度神经网络

  • 基于深度神经网络的机器学习称为深度学习。

人工智能可以做什么?

  1. 计算机视觉

  2. 语音识别

  3. 自然语言

计算机视觉典型技术

  • 人脸检测\追踪\识别\属性分析
  • 行人\车辆检测\追踪\识别\属性分析
  • 文字检测和识别
  • 物体检测和识别

计算机视觉典型应用

  • 人脸身份认证;
  • 智能交通;
  • 机器人视觉(无人机)
  • 图像搜索引擎
  • 图像和视频理解;
  • 图像和视频美化;

语音识别典型技术

  • 语音识别;
  • 声纹识别;
  • 多麦克风阵列系统;

语音识别典型应用

  • 语音输入
  • 语音控制
  • 智能助手
  • 机器翻译
  • 机器人听觉

自然语言典型技术

  • 词句嵌入
  • 语义模型

自然语言典型应用

  • 聊天机器人
  • 智能助手
  • 智能客服
  • 视频理解
  • 机器翻译

人工智能最热方向

  1. 计算机视觉

  2. 智能驾驶

  3. 机器人

  4. 智慧医疗

  5. 自然语言处理

  6. Ai芯片

  7. 智慧金融

  8. AI开放平台

  9. 生物识别

  10. AI大数据

计算机视觉(computer Vision)

  • 对图像中的客观对象构建明确而有意义的描述

  • 从一个或多个数字图像中计算三维世界的特征

  • 基于感知图像做出对客观对象和场景的有用的决策

  • 一句话:让计算机拥有人能所见,人能所识、人能所思的能力,就是计算机视觉

基于深度学习的计算机视觉

计算机视觉的应用

  • 图像分类
  • 目标检测
  • 目标跟踪
  • 语义分割
  • 实例分割

图像分类

  • 图像分类架构:卷积神经网络CNN

ReLU

RELU f(x)=max(0,x)

池化层-pool

目标检测

  • R-CNN

语以分割

  • FCN

实例分割

  • Mask R-CNN

计算机视觉应用领域

  • 安防

  • 交通

  • 工业生产

  • 在线购物

  • 信息检索

  • 游戏娱乐

  • 摄影摄像

  • 机器人/无人机

  • 体育

  • 医疗

计算机视觉技能树

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值