本算法是基于tensorflow,使用python语言进行的一种图像分类算法,参考于谷歌的mnist手写识别,包括以下几个模块:图像读取,图像处理,图像增强。卷积神经网络部分包括:卷积层1,汇合层1(部分文献也有叫池化层的),卷积层2,汇合层2,全连接层1,全连接层2,共6层神经网络。损失函数采用交叉熵,优化则采用adam优化法,由于数据集大小较小,只有200张图片,故没有采用MBGD梯度下降算法,直接采用BGD梯度下降算法。
首先是图像读取模块,由于本方案是应用于识别渣土车顶棚是否遮盖好的算法,所以没有网上现成的数据库,目前只有从网上收集图片,并转换成数据。
"""
定义一个遍历文件夹下所有图片,并转化为矩阵,压缩为特定大小,并传入一个总
的矩阵中去的函数
"""
def creat_x_database(rootdir,resize_row,resize_col):
#列出文件夹下所有的,目录和文件
list = os.listdir(rootdir)
#创建一个随机矩阵,作为多个图片转换为矩阵后传入其中
database=np.arange(len(list)*resize_row*resize_col*3).reshape(len(list)
,resize_row,resize_col,3)
for i in range(0,len(list)):
path = os.path.join(rootdir,list[i]) #把目录和文件名合成一个路径
if os.path.isfile(path): ##判断路径是否为文件
image_raw_data = tf.gfile.FastGFile(path,'rb').read()#读取图片
with tf.Session() as sess:
img_data = tf.image.decode_jpeg(image_raw_data)#图片解码
#压缩图片矩阵为指定大小
resized=tf.image.resize_images(img_data,[resize_row,resize_col]