连载一：PyCon2018｜用slim调用PNASNet模型(附源码)-CSDN博客

第八届中国Python开发者大会PyConChina2018，由PyChina.org发起，由来自CPyUG/TopGeek等社区的30位组织者，近150位志愿者在北京、上海、深圳、杭州、成都等城市举办。致力于推动各类Python相关的技术在互联网、企业应用等领域的研发和应用。

代码医生工作室有幸接受邀请，参加了这次会议的北京站专场。在会上主要分享了《人工智能实战案例分享-图像处理与数值分析》。

会上分享的一些案例主要是来源于《python带我起飞——入门、进阶、商业实战》一书与《深度学习之TensorFlow：入门、原理与进阶实战》一书。另外，还扩充了若干其它案例。在本文作为补充，将会上分享的其它案例以详细的图文方式补充进来，并提供源码。共分为4期连载。

用slim调用PNASNet模型
用slim微调PNASNet模型
用对抗样本攻击PNASNet模型
恶意域名检测实例

使用AI模型来识别图像是桌子、猫、狗，还是其他

本章将演示一个应用AI模型进行图像识别的例子。通过该实例能够让读者真真切切的感受到AI的强大，及使用模型的操作过程。

案例描述

通过代码载入现有模型，对任意图片进行分类识别，观察识别结果。

本案使用的是在ImgNet数据集上训练好的PNASNet模型。PNASNet模型是目前最优秀的图片识别模型之一。该模型在ImgNet数据集上训练后，可以识别1000种类别的图片。要完成该案例，需要先下载TensorFlow中的models模块及对应的与训练模型。下面就来详细介绍。

代码环境及模型准备

为了使读者能够快速完成该实例，直观上感受到模型的识别能力，可以直接使用本书配套的资源。并将其放到代码的同级目录下即可。

如果想体验下从零开始手动搭建，也可以按照下面的方法准备代码环境及预编译模型。

1. 下载TensorFlow models模块

TensorFlow models模块中包含了使用TensorFlow框架完成的各种不同模型，可以直接拿来使用。在TensorFlow models模块中进行二次开发，可以使AI项目开发变得简单快捷。来到以下网址：

github.com/tensorflow/…

可以通过git 将代码clone下来，也可以手动下载（具体操作见《深度学习之TensorFlow：入门、原理与进阶实战》一书的8.5.2节）。

2. 部署TensorFlow slim模块

解压之后，将其中\models-master\research路径下的slim文件夹（如图1），复制到本地代码的同级路径下。

图1 slim代码库路径

slim库又叫做TF-slim，是TensorFlow 1.0之后推出的一个新的轻量级高级API接口。将很多常见TensorFlow函数做了二次封装，使代码变得更加简洁。

在TF-slim模块里面同时提供了大量用TF-slim写好的网络模型结构代码，以及用该代码训练出的模型文件。本例中就是使用TF-slim模块中训练好的PNASNet模型文件。

3. 下载PNASNet模型

访问如下网站，可以下载训练好的PNASNet模型：

github.com/tensorflow/…

该链接打开后，可以找到“pnasnet-5_large_2017_12_13.tar.gz”的下载地址，如图2。

图2 PNASNet模型下载页面

下载完后，将其解压，会得到如下图3中的文件结构。

图3 PNASNet模型文件

将整个pnasnet-5_large_2017_12_13文件夹放到本地代码的同级目录下。在使用时，只需要指定好模型的路径：“pnasnet-5_large_2017_12_13”，系统便会自动加载模型里面的文件及内容。

注意：

在图2中，可以看到，出来本实例所用的PNASNet模型外，还有好多其他的模型。其中倒数第二行的mobilenet_v2_1.0_224.tgz模型也是比较常用的，该模型体积小、运算快，常用于在移动设备。

4. 准备ImgNet数据集标签

由于本例中使用的PNASNet预训练模型是在ImgNet数据集上训练好的模型，在使用该模型分类是，还需要有与其对应的标签文件。slim中已经将获得标签文件的操作直接封装到了代码里，直接调用即可。由于标签文件是英文分类，读起来不太直观。这里提供了一个翻译好的中文标签分类文件“中文标签.csv”。也在书籍同步的配套资源中。

前面4项都准备好后，整体的目录结构如图4所示。

图4 实例1文件结构

在图4中，会看到还有三个图片文件“72.jpg”、“hy.jpg”、“ps.jpg”，这三个文件是用于测试使用的图片，读者可以替换为自己所要识别的文件。

代码实现：初始化环境变量，并载入ImgNet标签

首先将本地的slim作为引用库载入到系统的环境变量里。接着将ImgNet标签载入并显示出来。

  import sys                                                 #初始化环境变量
  nets_path = r'slim'
  if nets_path not in sys.path:
     sys.path.insert(0,nets_path)
  else:
     print('already add slim')
 
  import tensorflow as tf                                   #引入头文件
  from PIL import Image
 from matplotlib import pyplot as plt
 from nets.nasnet import pnasnet
 import numpy as np
 from datasets import imagenet
 slim = tf.contrib.slim

 tf.reset_default_graph()                       
 
 image_size = pnasnet.build_pnasnet_large.default_image_size       #获得图片输入尺寸
 labels = imagenet.create_readable_names_for_imagenet_labels()     #获得数据集标签
 print(len(labels),labels)                                             #显示输出标签

 def getone(onestr):
    return onestr.replace(',',' ')

 with open('中文标签.csv','r+') as f:                             #打开文件               
    labels =list( map(getone,list(f))  )
    print(len(labels),type(labels),labels[:5]) 
复制代码

使用AI模型来识别图像

代码中提供了英文与中文的两种标签。在实际应用中使用了中文的标签。程序运行后输出结果如下：

1001 {0: 'background', 1: 'tench, Tinca tinca', 2: 'goldfish, Carassius auratus', 3: 'great white shark, white shark, man-eater, man-eating shark, Carcharodon carcharias', 4: 'tiger shark, Galeocerdo cuvieri', 5: 'hammerhead, hammerhead shark',……,994: 'gyromitra', 995: 'stinkhorn, carrion fungus', 996: 'earthstar', 997: 'hen-of-the-woods, hen of the woods, Polyporus frondosus, Grifola frondosa', 998: 'bolete', 999: 'ear, spike, capitulum', 1000: 'toilet tissue, toilet paper, bathroom tissue'}

1001 <class 'list'> ['背景known \n', '丁鲷 \n', '金鱼 \n', '大白鲨 \n', '虎鲨 \n']

一共输出了两行，第一行为英文标签，第二行为中文标签。

代码实现：定义网络结构

通过代码，定义了占位符input_imgs，用于输入待识别的图片。接着定义网络节点end_points，对接预训练模型的输出节点。end_points是一个字典，里面Predictions对应的值就是最终的输出结果。该值中放置着1000个元素的数组，代表预测图片在这1000个分类中的概率。通过tf.argmax函数对最终结果进行转化，得到数组中最大的那个数的索引，便是该图片的分类。

 sample_images = ['hy.jpg', 'ps.jpg','72.jpg']                   #定义待测试图片路径

 input_imgs = tf.placeholder(tf.float32, [None, image_size,image_size,3]) #定义占位符

 x1 = 2 *( input_imgs / 255.0)-1.0                                 #归一化图片

 arg_scope = pnasnet.pnasnet_large_arg_scope()                  #获得模型命名空间
 with slim.arg_scope(arg_scope):
    logits, end_points = pnasnet.build_pnasnet_large(x1,num_classes = 1001, is_training=False)   
    prob = end_points['Predictions']
    y = tf.argmax(prob,axis = 1)                                  #获得结果的输出节点
复制代码

使用AI模型来识别图像（续）

在34行代码中的arg_scope是命名空间的意思。在TensorFlow中相同名称的不同张量是通过命名空间来划分的。关于命名空间的更多知识可以参考《深度学习之TensorFlow：入门、原理与进阶实战》一书的4.3节。

代码中第28行指定了待识别图片的名称。如果想识别自己的图片，直接修改该行代码中的图片名称即可。

代码实现：载入模型进行识别

指定好要加载的预训练模型，建立会话进行图片识别。

 checkpoint_file = r'pnasnet-5_large_2017_12_13\model.ckpt'       #定义模型路径
 saver = tf.train.Saver()                                                #定义saver，用于加载模型
 with tf.Session() as sess:                                              #建立会话
    saver.restore(sess, checkpoint_file)                            #载入模型

    def preimg(img):                                    #定义图片预处理函数
        ch = 3
        if img.mode=='RGBA':                            #兼容RGBA图片
            ch = 4 

        imgnp = np.asarray(img.resize((image_size,image_size)), 
                          dtype=np.float32).reshape(image_size,image_size,ch)
        return imgnp[:,:,:3] 

    #获得原始图片与预处理图片
    batchImg = [ preimg( Image.open(imgfilename) ) for imgfilename in sample_images ]
    orgImg = [  Image.open(imgfilename)  for imgfilename in sample_images ]

    yv,img_norm = sess.run([y,x1], feed_dict={input_imgs: batchImg})    #输入到模型

    print(yv,np.shape(yv))                                              #显示输出结果         
    def showresult(yy,img_norm,img_org):                            #定义显示图片函数
        plt.figure()  
        p1 = plt.subplot(121)
        p2 = plt.subplot(122)
        p1.imshow(img_org)                                        #显示图片
        p1.axis('off') 
        p1.set_title("organization image")

        p2.imshow(img_norm)                                        #显示图片
        p2.axis('off') 
        p2.set_title("input image")  

        plt.show()
        print(yy,labels[yy])

    for yy,img1,img2 in zip(yv,batchImg,orgImg):                    #显示每条结果及图片
        showresult(yy,img1,img2)
复制代码