《计算机视觉》----第一章人工智能概述-CSDN博客

本文链接：https://blog.csdn.net/weixin_40064515/article/details/141058332

AI技术的三要素为数据，算法，和计算资源。
算法：
深度学习是AI技术中最流行的算法，其基础算法已经较为成熟。各大厂商纷纷发力建设算法模型工具库，并将其封装为软件框架，供开发者使用。常见的深度学习软件框架
Tensorflow 谷歌神经网络开源库
torch Facebook
发展历程：
1986年，BP算法，不断地调整神经元之间的权值和阈值，直到输出误差减小为允许的范围，或达到预先设定的训练次数为止。能解决非线性分类问题。但计算机的硬件水平有限，运算能力跟不上算法的要求，这就导致当神经网络的规模增大时，使用BP算法会出现梯度消失问题。
2006年，Hinton提出了深度学习概念，给出了梯度消失问题的解决方案，即通过无监督的学习方法逐层训练算法，再使用有监督的反向传播算法进行调优。
2012年，ImageNet大赛中，提出Alexnet 夺冠。采用Relu激活函数，从根本上解决了梯度消失问题，并采用GPU极大地提高了模型的运算速度。
2016年，谷歌AlphaGo ，深度学习获得了前所未有的关注。
之计算资源：
2015年，随着GPU的广泛使用，AI技术迎来真正的大爆发。硬件算力的提升是AI快速发展的基础。

主要的人工智能芯片：

之数据：
数据是生产材料，通过算法及计算资源完成生产力的升级。
图像分类数据库：
1.MNIST
2CIFAF-10
10个类别，多达60000张的32*32像素彩色图像（5万张训练图像和1万张测试图像），平均每种类别拥有6000张图像。
3CIFAR-100
100个类别，每个类别包含600张图像
4.caltech-ucsd birds-200-2011
包含200种鸟类，照片的图像数据集。可用于图像识别。类别数量为200类；图片数量为11788张。平均每张图片含有的标注数量包括15个局部位置、
5.caltech 101 包含101种物品类别的图像数据集。平均每个类别拥有40-800张图像，
6oxford pet 包含37种宠物类别的图像数据集。
7 oxford 102 flowers 包含102种花类的图像数据集
8 food -101 101种食品类别的图像数据集
9 stanford cars 包含196种汽车类别的图像数据集
2.目标检测、定位与分割数据库
1.camvid 700张包含像素级别语义分割的道路交通图像分割数据集
2.Pascal voc 用于目标检测与分割的标准图像数据集
3.coco数据集用于目标检测与分割。
4.KITTI数据集自动驾驶场景下的计算机视觉算法评测数据集
5.cityscape 数据集城市街道场景的语义理解图片数据集
视频分析技术的应用案例
人工智能的宗旨是通过机器代替人来完成人类正在做的工作，通过计算机完成视频分析、理解并根据人类的经验做出决策事人工智能系统的重要组成部分。图像分类，目标检测，图像分割和目标跟踪是视频分析技术中的关键技术。将以上四种关键技术相互结合可以完成人工智能视觉感知的任务。
1基于人脸识别技术的罪犯抓捕系统