ImageAI的介绍（1）-CSDN博客

本文链接：https://blog.csdn.net/weixin_43810267/article/details/106431943

昨天看见一个关于叫做ImageAIpython库，说真的，因为真的太简单粗暴了，相比于用一些其它的深度学习框架，这个真的是太容易上手了，简单到我到不需要介绍。以为实在是太好用了，所以在这里给小伙伴们介绍一下。

PS：忘了介绍它可以干啥了，ImageAI支持最先进的机器学习算法，用于图像预测，自定义图像预测，物体检测，视频检测，视频对象跟踪和图像预测训练。ImageAI目前支持使用在ImageNet-1000数据集上训练的4种不同机器学习算法进行图像预测和训练。ImageAI还支持使用在COCO数据集上训练的RetinaNet进行对象检测，视频检测和对象跟踪。最终，ImageAI将为计算机视觉提供更广泛和更专业化的支持，包括但不限于特殊环境和特殊领域的图像识别。

（一）环境的配置

说真的环境的配置并不难，但是我在上面还是走了一些弯路，废话不多说，我们开始环境的配置。环境的配置我还推荐使用anaconda，它可以让你方便的管理你的环境，使库的安装与升级变得非常简单，基本上大都数的库，你都可以在anaconda navigator找到并安装。

那么，你需要安装那些环境呢

python 我这里使用的是python3.7.7
opencv 这个当然少不了，这里我用的是opencv 3.4.2
tensorflow 我这里用的是tensorflow 1.15.0
keras 我这里用的是2.3.1
pillow 我这里用的是7.1.2
matplotlib 我这里用的是3.1.3
ImageAI 这个需要pip安装，你可以pip3 install https://github.com/OlafenwaMoses/ImageAI/releases/download/2.0.1/imageai-2.0.1-py3-none-any.whl，或者下载Python Wheel imageai-2.0.1-py3-none-any.whl 安装文件并在命令行中指定安装文件的路径来安装ImageAI：pip3 install C:\User\MyUser\Downloads\imageai-2.0.1-py3-none-any.whl

Python Wheel imageai-2.0.1-py3-none-any.whl的百度网盘下载地址
提取码：uknd

这里还用一些其它的库（Numpy，SciPy ，h5py）我没用说，因为我在用anaconda navigator安装python和opencv时，这几个库就一起被安装了。还有就是，我一开始tensorflow用的是2.0以上的，但运行程序就会报错，所我建议如果你想玩一下这个的话，就安装和我一样的版本（但这并不代表其他版本不行）。

还有就是，我强烈建议使用GPU,因为视频对象检测是非常消耗硬件资源的任务，所以我们建议你使用安装了 NVIDIA GPU 和 GPU 版 Tensorflow ，你用CPU训练和跑程序和别人高性能的GPU比起来就是人家几小时，你几天甚至几星期，几个月都可能，还有可能搞坏你的电脑。

当然以上所有的环境你都可以pip，如果遇到啥问题，你可以私信我，但不保正一定可以帮你解决

（二）使用ImageAI预测图片

这里我们先不讲如何训练模型，我们先体验一下。

首先，我们要先下载已经训练模型文件
ResNet模型下载地址

下面我们要实现的功能是，识别一张图片上的物体，并把它们的物体名称打印出来

上代码（代码不是我写的，官方demo）：

from imageai.Prediction import ImagePrediction
import os
#上面的代码导入了ImageAI库和 python os 类。
execution_path = os.getcwd()
#上面的代码获取包含python文件的文件夹路径（在本例中python文件为FirstPrediction.py）。

prediction = ImagePrediction()
prediction.setModelTypeAsResNet()
prediction.setModelPath(os.path.join(execution_path, "resnet50_weights_tf_dim_ordering_tf_kernels.h5"))
prediction.loadModel()
'''
在上面的代码中，我们对ImagePrediction()类进行了实例化，第二行
调用了.setModelTypeAsResNet()函数将预测对象的模型类型设置为ResNet，第三行
设置了模型文件（resnet50_weights_tf_dim_ordering_tf_kernels.h5）的路径，第四行载入模型。
'''

predictions, probabilities = prediction.predictImage(os.path.join(execution_path, "people.jpg"), result_count=5 )
'''
在上面的代码中，我们定义了两个变量，他们的值将由所调用的函数
predictImage()返回，其中predictImage()函数接受了两个参数，一个是指
定要进行图像预测的图像文件路径，另一个参数result_count用于设置
我们想要预测结果的数量（该参数的值可选1 to 100）。最后，predictImage()函数将返回预测的
对象名和相应的百分比概率（percentage_probabilities）。
'''

for eachPrediction, eachProbability in zip(predictions, probabilities):
    print(eachPrediction + " : " + eachProbability)
'''
在上面的代码获取了predictions变量中的每个对象名，
并从probabilities变量中获取相应的百分比概率，最后将两者的结果打印到终端。
'''

别看这么一大串，其实起作用的，就几行，基本上都封装好了。说真的，如果开发者愿意，除去开始导入库的那几句，它完全可以一句解决
在这里插入图片描述
上面是使用ResNet对图片进行预测，你还可以使用DenseNet，InceptionV3 ，SqueezeNet对图片进行预测。你只需要修改prediction.setModelTypeAsResNet()，将后面的ResNet改为你接下来想要使用的模型名字（目前只能是上面3个），你还需修改的是prediction.setModelPath(os.path.join(execution_path, “resnet50_weights_tf_dim_ordering_tf_kernels.h5”))，就是这行代码加粗的部分，将其改为你想要的模型文件的名字（你下载模型的文件就是模型的名字），下面我会贴上模型文件的下载地址。
SqueezeNet模型下载地址
 InceptionV3模型下载地址
 DenseNet模型下载地址
如果有小伙伴文件下载不下来，可以私信找我

还有的就是，你还可以设置图片检测的速度，你只需要将这一行prediction.loadModel()进行修改，将其改为prediction.loadModel(prediction_speed=“fast”)，其中加粗的部分可以改为normal, fast, faster , fastest，默认为normal

ImageAI还可以设置多线程，感兴趣的小伙伴自行百度吧

注：ImageAI是一个python库，旨在使开发人员能够使用简单的几行代码构建具有包含深度学习和计算机视觉功能的应用程序和系统。这个AI Commons项目https://commons.specpal.science 由Moses Olafenwa和John Olafenwa开发和维护