基于cnn的图像二分类算法（一）

最新推荐文章于 2024-07-19 22:47:54 发布

lxdssg

最新推荐文章于 2024-07-19 22:47:54 发布

阅读量2.3w

点赞数 10

分类专栏： ML 文章标签： cnn 卷积神经网络图像分类 tensorflow python

本文链接：https://blog.csdn.net/lxdssg/article/details/81233837

版权

该博客介绍了利用TensorFlow和Python实现的基于CNN的图像二分类算法，主要应用于渣土车顶棚是否遮盖的识别。内容涵盖了图像读取、处理、增强，以及CNN网络结构设计，包括卷积层、池化层、全连接层。博主在训练过程中遇到模型不收敛的问题，并分享了解决方案。最终模型精度达到75%，未来计划优化超参数、增加样本量和训练次数。

摘要由CSDN通过智能技术生成

本算法是基于tensorflow，使用python语言进行的一种图像分类算法，参考于谷歌的mnist手写识别，包括以下几个模块：图像读取，图像处理，图像增强。卷积神经网络部分包括：卷积层1，汇合层1（部分文献也有叫池化层的），卷积层2，汇合层2，全连接层1，全连接层2，共6层神经网络。损失函数采用交叉熵，优化则采用adam优化法，由于数据集大小较小，只有200张图片，故没有采用MBGD梯度下降算法，直接采用BGD梯度下降算法。

首先是图像读取模块，由于本方案是应用于识别渣土车顶棚是否遮盖好的算法，所以没有网上现成的数据库，目前只有从网上收集图片，并转换成数据。

"""
定义一个遍历文件夹下所有图片，并转化为矩阵，压缩为特定大小，并传入一个总
的矩阵中去的函数
"""      
def creat_x_database(rootdir,resize_row,resize_col):
    #列出文件夹下所有的，目录和文件
    list = os.listdir(rootdir)
    #创建一个随机矩阵，作为多个图片转换为矩阵后传入其中
    database=np.arange(len(list)*resize_row*resize_col*3).reshape(len(list)
    ,resize_row,resize_col,3)
    for i in range(0,len(list)):
        path = os.path.join(rootdir,list[i])    #把目录和文件名合成一个路径
        if os.path.isfile(path):                ##判断路径是否为文件
            image_raw_data = tf.gfile.FastGFile(path,'rb').read()#读取图片
            with tf.Session() as sess:
                img_data = tf.image.decode_jpeg(image_raw_data)#图片解码
                #压缩图片矩阵为指定大小
                resized=tf.image.resize_images(img_data,[resize_row,resize_col]

最低0.47元/天解锁文章

lxdssg

关注

10
点赞
踩
100

收藏

觉得还不错? 一键收藏
3
评论
基于cnn的图像二分类算法（一）

本算法是基于tensorflow，使用python语言进行的一种图像分类算法，参考于谷歌的mnist手写识别，包括以下几个模块：图像读取，图像处理，图像增强。卷积神经网络部分包括：卷积层1，汇合层1（部分文献也有叫池化层的），卷积层2，汇合层2，全连接层1，全连接层2，共6层神经网络。损失函数采用交叉熵，优化则采用adam优化法，由于数据集大小较小，只有200张图片，故没有采用MBGD梯度下降算法...
复制链接

扫一扫