TensorFlow 卷积神经网络之猫狗识别(二)

本文是TensorFlow 卷积神经网络之猫狗识别
的姊妹篇,是加载上一篇博客训练好的模型,进行猫狗识别

本文逻辑:

  1. 我从网上下载了十几张猫和狗的图片,用于检验我们训练好的模型。
  2. 处理我们下载的图片
  3. 加载模型
  4. 将图片输入模型进行检验

代码如下:

#coding=utf-8  
import tensorflow as tf 
from PIL import Image  
import matplotlib.pyplot as plt
import input_data 
import numpy as np
import model
import os 
  
#从指定目录中选取一张图片 
def get_one_image(train): 
    files = os.listdir(train)
    n = len(files)
    ind = np.random.randint(0,n)
    img_dir = os.path.join(train,files[ind])  
    image = Image.open(img_dir)  
    plt.imshow(image)
    plt.show()
    image = image.resize([208, 208])  
    image = np.array(image)
    return image  
  
  
def evaluate_one_image():  
	#存放的是我从百度下载的猫狗图片路径
    train = '/Users/yangyibo/GitWork/pythonLean/AI/猫狗识别/testImg/' 
    image_array = get_one_image(train)  
      
    with tf.Graph().as_default():  
        BATCH_SIZE = 1  # 因为只读取一副图片 所以batch 设置为1
        N_CLASSES = 2  # 2个输出神经元,[1,0] 或者 [0,1]猫和狗的概率
        # 转化图片格式
        image = tf.cast(image_array, tf.float32)  
        # 图片标准化
        image = tf.image.per_image_standardization(image)
        # 图片原来是三维的 [208, 208, 3] 重新定义图片形状 改为一个4D  四维的 tensor
        image = tf.reshape(image, [1, 208, 208, 3])  
        logit = model.inference(image, BATCH_SIZE, N_CLASSES)  
        # 因为 inference 的返回没有用激活函数,所以在这里对结果用softmax 激活
        logit = tf.nn.softmax(logit)  
        
        # 用最原始的输入数据的方式向模型输入数据 placeholder
        x = tf.placeholder(tf.float32, shape=[208, 208, 3])  
        
        # 我门存放模型的路径
        logs_train_dir = '/Users/yangyibo/GitWork/pythonLean/AI/猫狗识别/saveNet/'   
        # 定义saver 
        saver = tf.train.Saver()  
          
        with tf.Session() as sess:  
              
            print("从指定的路径中加载模型。。。。")
            # 将模型加载到sess 中 
            ckpt = tf.train.get_checkpoint_state(logs_train_dir)  
            if ckpt and ckpt.model_checkpoint_path:  
                global_step = ckpt.model_checkpoint_path.split('/')[-1].split('-')[-1]  
                saver.restore(sess, ckpt.model_checkpoint_path)  
                print('模型加载成功, 训练的步数为 %s' % global_step)  
            else:  
                print('模型加载失败,,,文件没有找到')  
            # 将图片输入到模型计算
            prediction = sess.run(logit, feed_dict={x: image_array})
            # 获取输出结果中最大概率的索引
            max_index = np.argmax(prediction)  
            if max_index==0:  
                print('猫的概率 %.6f' %prediction[:, 0])  
            else:  
                print('狗的概率 %.6f' %prediction[:, 1]) 
# 测试
evaluate_one_image()

/Users/yangyibo/GitWork/pythonLean/AI/猫狗识别/testImg/ 存放的是我从百度下载的猫狗图片
这里写图片描述

执行结果:
因为从testimg 中选取图片是随机的,所以每次执行的结果不同

从指定的路径中加载模型。。。。
模型加载成功, 训练的步数为 11999
狗的概率 0.964047
[Finished in 6.8s]

代码地址:https://github.com/527515025/My-TensorFlow-tutorials/blob/master/猫狗识别/evaluateCatOrDog.py

欢迎star。

### 回答1: Python可以通过TensorFlow卷积神经网络来实现猫狗识别卷积神经网络是一种深度学习模型,可以对图像进行分类和识别。在猫狗识别中,我们可以使用卷积神经网络来训练模型,使其能够准确地识别猫和狗的图像。具体实现过程需要涉及到数据预处理、模型构建、训练和测试等步骤。 ### 回答2: 猫狗识别是计算机视觉领域的一个重要任务,其中卷积神经网络是一种常用的深度学习模型。Python语言可以通过TensorFlow框架实现卷积神经网络来识别猫狗。 卷积神经网络主要由卷积层、池化层、全连接层和softmax输出层组成。卷积层可以提取图像的特征,池化层可以压缩图像的大小,全连接层可以将提取的特征映射到类别,最后softmax输出层可以将最终结果归一化为概率。 在Python中,可以使用TensorFlow的高级API来构建卷积神经网络。首先需要导入相关模块和数据集,例如: ``` import tensorflow as tf from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout from tensorflow.keras.preprocessing.image import ImageDataGenerator train_datagen = ImageDataGenerator(rescale=1./255) val_datagen = ImageDataGenerator(rescale=1./255) train_generator = train_datagen.flow_from_directory( 'train', target_size=(150, 150), batch_size=32, class_mode='binary') validation_generator = val_datagen.flow_from_directory( 'validation', target_size=(150, 150), batch_size=32, class_mode='binary') ``` 以上代码中,首先导入了需要使用的模块,然后使用`ImageDataGenerator`对训练集和验证集进行数据增强和归一化处理,最后用`flow_from_directory`方法读取数据集并设置相关参数。 接下来可以构建卷积神经网络,例如: ``` model = tf.keras.models.Sequential([ Conv2D(32, (3,3), activation='relu', input_shape=(150, 150, 3)), MaxPooling2D(2,2), Conv2D(64, (3,3), activation='relu'), MaxPooling2D(2,2), Conv2D(128, (3,3), activation='relu'), MaxPooling2D(2,2), Conv2D(128, (3,3), activation='relu'), MaxPooling2D(2,2), Flatten(), Dense(512, activation='relu'), Dropout(0.5), Dense(1, activation='sigmoid') ]) ``` 以上代码中,先使用`Sequential`方法定义模型,然后添加卷积层、池化层、全连接层和输出层,其中使用了`Dropout`方法进行正则化操作。最后可以使用`compile`方法来配置模型训练所需的优化器、损失函数和评估指标,例如: ``` model.compile(optimizer='rmsprop', loss='binary_crossentropy', metrics=['accuracy']) ``` 训练模型时,可以使用`fit`方法来训练模型并评估模型的性能,例如: ``` history = model.fit_generator( train_generator, steps_per_epoch=100, epochs=30, validation_data=validation_generator, validation_steps=50) ``` 以上代码中,`fit_generator`方法可以对模型进行训练,其中需要设置训练集和验证集的`generator`,以及设置训练的步数和训练的轮数等参数。 在训练完卷积神经网络后,可以使用`save`方法将训练好的模型保存下来,例如: ``` model.save('cat_dog_model.h5') ``` 以上代码中,`save`方法可以将模型保存到本地文件,并可以在后续使用时进行加载和使用。 总之,通过Python和TensorFlow框架可以很方便地实现卷积神经网络进行猫狗识别,从而可以对计算机视觉领域有更深入的了解和实践。 ### 回答3: 猫狗识别是计算机视觉中的一个重要问题,可以通过卷积神经网络(CNN)来解决。Python语言中的TensorFlow库提供了方便的实现方式。 首先,需要准备猫狗的图像数据集,并将图像转换为数据矩阵。数据集可以使用Kaggle上的Dogs vs. Cats数据集,或自己收集。对于图像的处理,可以使用Pillow库。 接下来,需要构建卷积神经网络模型。在TensorFlow中,可以使用Keras API来创建并编译模型。简单来说,卷积神经网络由卷积层、池化层、全连接层等组成。其中,卷积层是用于提取特征的主要层,池化层是用于减少特征图大小的层,全连接层将特征图转换为最终输出。 在模型构建完成后,需要进行训练和验证。在TensorFlow中,可以使用fit()函数来进行训练。训练时,需要指定损失函数、优化器以及评估指标,并通过epochs和batch_size参数设置迭代次数和每个批次的样本数。验证时,可以使用evaluate()函数评估模型性能。 最后,可以使用预测函数predict()来识别新的猫狗图像数据。通过将预测结果与实际标签比较,可以评估模型的准确率和可靠性。 总之,通过Python语言中的TensorFlow库实现猫狗识别需要准备数据集、构建模型、进行训练和验证等步骤。相比其他传统机器学习算法,使用卷积神经网络可以显著提高识别准确率,让计算机更加智能化。
评论 131
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值