《计算机视觉》----第一章 人工智能概述

 AI技术的三要素为数据,算法,和计算资源。
算法:
深度学习是AI技术中最流行的算法,其基础算法已经较为成熟。各大厂商纷纷发力建设算法模型工具库,并将其封装为软件框架,供开发者使用。常见的深度学习软件 框架
Tensorflow 谷歌 神经网络开源库
torch Facebook 
发展历程:
1986年,BP算法,不断地调整神经元之间的权值和阈值,直到输出误差减小为允许的范围,或达到预先设定的训练次数为止。能解决非线性分类问题。但计算机的硬件水平有限,运算能力跟不上算法的要求,这就导致当神经网络的规模增大时,使用BP算法会出现梯度消失问题。
2006年,Hinton提出了深度学习概念,给出了梯度消失问题的解决方案,即通过无监督的学习方法逐层训练算法,再使用有监督的反向传播算法进行调优。
2012年,ImageNet大赛中,提出Alexnet 夺冠。采用Relu激活函数,从根本上解决了梯度消失问题,并采用GPU极大地提高了模型的运算速度。
2016年,谷歌AlphaGo ,深度学习获得了前所未有的关注。
之计算资源:
2015年,随着GPU的广泛使用,AI技术迎来真正的大爆发。硬件算力的提升是AI快速发展的基础。

主要的人工智能芯片:

之数据:
数据是生产材料,通过算法及计算资源完成生产力的升级。
图像分类数据库:
1.MNIST 
2CIFAF-10 
10个类别,多达60000张的32*32像素彩色图像(5万张训练图像和1万张测试图像),平均每种类别拥有6000张图像。
3CIFAR-100
100个类别,每个类别包含600张图像
4.caltech-ucsd birds-200-2011
包含200种鸟类,照片的 图像数据集。可用于图像识别。类别数量为200类;图片数量为11788张。平均每张图片含有的标注数量包括15个局部位置、
5.caltech 101 包含101种物品类别的图像数据集。平均每个类别拥有40-800张图像,
6oxford pet 包含37种宠物类别的图像数据集。
7 oxford 102 flowers 包含102种花类的图像数据集
8 food -101 101种食品类别的图像数据集
9 stanford cars 包含196种汽车类别的图像数据集
2.目标检测、定位与分割数据库
1.camvid 700张包含像素级别语义分割的道路交通图像分割数据集
2.Pascal voc 用于目标检测与分割的标准图像数据集
3.coco数据集 用于目标检测与分割。
4.KITTI数据集 自动驾驶场景下的计算机视觉算法评测数据集
5.cityscape 数据集 城市街道场景的语义理解图片数据集
视频分析技术的应用案例
人工智能 的宗旨是通过机器代替人来完成人类正在做的工作,通过计算机完成视频分析、理解并根据人类的经验 做出决策事人工智能系统的重要组成部分。图像分类,目标检测,图像分割和目标跟踪是视频分析技术中的关键技术。将以上四种关键技术相互结合可以完成人工智能视觉感知的任务。
1基于人脸识别技术的罪犯抓捕系统




 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值