卷积神经网络简单的应用（二）：模型构建与训练

最新推荐文章于 2021-12-04 10:38:37 发布

站住这个领域

最新推荐文章于 2021-12-04 10:38:37 发布

阅读量2.9k

点赞数 2

分类专栏：卷积神经网络简单的应用

本文链接：https://blog.csdn.net/Good_Boyzq/article/details/79743403

版权

卷积神经网络简单的应用专栏收录该内容

3 篇文章 0 订阅

订阅专栏

模型构建
文中采用了Tensorflow框架进行模型的构建，这里简单介绍下Tensorflow的安装（在Anaconda上安装）：
⑴Anaconda安装：https://www.anaconda.com/download/，选择支持py36的版本；
⑵直接在命令行中安装Tensorflow：pip install tensorflow；
⑶测试是否已经安装好Tensorflow：import tensorflow as tf，是否报错。
由于自己电脑比较low，卷积神经网络的参数以及深度都不是很多，其结构如下图所示。图中Cov为卷积操作，Pool为池化操作。

创建该模型结构的代码如下：

def create_cnn(out_size,w_alpha = 0.01,b_alpha = 0.01):#out_size：输出类别个数
    x = tf.reshape(X,shape=[-1,200,150,3])    
    #第一层
    w_c1_1 = tf.Variable(w_alpha*tf.random_normal([3,3,1,32]))
    b_c1_1 = tf.Variable(b_alpha*tf.random_normal([32]))
    conv1_1 = tf.nn.relu(tf.nn.bias_add(tf.nn.conv2d(x,w_c1_1,strides=[1,1,1,1],padding='SAME'),b_c1_1))
                
    conv1 = tf.nn.max_pool(conv1_1,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')
    conv1 = tf.nn.dropout(conv1,keep_prob)
    print(conv1.get_shape().as_list())
    #第二层
    w_c2_1 = tf.Variable(w_alpha*tf.random_normal([3,3,32,64]))
    b_c2_1 = tf.Variable(b_alpha*tf.random_normal([64]))
    conv2_1 = tf.nn.relu(tf.nn.bias_add(tf.nn.conv2d(conv1,w_c2_1,strides=[1,1,1,1],padding='SAME'),b_c2_1))
      
    conv2 = tf.nn.max_pool(conv2_1,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')
    conv2 = tf.nn.dropout(conv2,keep_prob)
    print(conv2.get_shape().as_list())
    #第三层
    w_c3_1 = tf.Variable(w_alpha*tf.random_normal([3,3,64,128]))
    b_c3_1 = tf.Variable(b_alpha*tf.random_normal([128]))
    conv3_1 = tf.nn.relu(tf.nn.bias_add(tf.nn.conv2d(conv2,w_c3_1,strides=[1,1,1,1],padding='SAME'),b_c3_1))        
    
    conv3 = tf.nn.max_pool(conv3_1,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')
    conv3 = tf.nn.dropout(conv3,keep_prob)
    print(conv3.get_shape().as_list())
    #第四层
    w_c4_1 = tf.Variable(w_alpha*tf.random_normal([3,3,128,128]))
    b_c4_1 = tf.Variable(b_alpha*tf.random_normal([128]))
    conv4_1 = tf.nn.relu(tf.nn.bias_add(tf.nn.conv2d(conv3,w_c4_1,strides=[1,1,1,1],padding='SAME'),b_c4_1))        
    
    conv4 = tf.nn.max_pool(conv4_1,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')
    conv4 = tf.nn.dropout(conv4,keep_prob)
    print(conv4.get_shape().as_list())
    
    #第五层    
    #fully connect layer    
    shp = conv4.get_shape()
    flattened_shape = shp[1].value * shp[2].value * shp[3].value
    dense = tf.reshape(conv4,[-1,flattened_shape])
    
    w_d = tf.Variable(w_alpha*tf.random_normal([flattened_shape,256]))
    b_d = tf.Variable(b_alpha*tf.random_normal([256]))
    
    dense = tf.nn.relu(tf.add(tf.matmul(dense,w_d),b_d))
    dense = tf.nn.dropout(dense,keep_prob)
    print(dense.get_shape().as_list())
    
    w_out = tf.Variable(w_alpha*tf.random_normal([256,out_size]))
    b_out = tf.Variable(b_alpha*tf.random_normal([out_size]))
    out = tf.add(tf.matmul(dense,w_out),b_out)
    print(out.get_shape().as_list())
    
    return out

模型训练
模型训练时主要是损失的定义以及优化器的定义，Tensorflow中已经定义好了一些损失函数和优化器，这里采用的损失函数为：tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits())，优化器选择的是：AdadeltaOptimizer；在训练的同时计算其识别率，达到给定的识别率时，模型就停止训练；相关代码如所示：

def train_cnn(x_data,y_data):
    output = create_cnn(4)
    print("create cnn end!")
    #损失
    loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(labels=Y,logits=output))
    #优化器
    optimizer = tf.train.AdadeltaOptimizer(learning_rate=0.1).minimize(loss)
    #分别获取输出和实际最大值的index
    max_idx_p = tf.argmax(output,1)
    max_idx_l = tf.argmax(Y,1)    
    
    correct_pred = tf.equal(max_idx_p,max_idx_l)
    accuracy = tf.reduce_mean(tf.cast(correct_pred,tf.float32))
    
    saver = tf.train.Saver(max_to_keep=3)
    with tf.Session() as sess:
        sess.run(tf.global_variables_initializer())
        
        step = 0
        while True:
            #获取文件中的相关图片为一个batch
            batch_x,batch_y = get_next_batch_from_file()
            _,loss_ = sess.run([optimizer,loss],feed_dict = {X:batch_x,Y:batch_y,keep_prob:0.75})
            print(step,loss_)
            if step % 10 == 0 and step != 0:
                batch_x_test,batch_y_test = get_next_batch_from_file()
                acc = sess.run(accuracy,feed_dict={X:batch_x_test,Y:batch_y_test,keep_prob:1.0})
                print(step,acc)
                if acc > 0.7:
                    saver.save(sess,"./model/cnn.model",global_step=step)
                if acc > 0.8:
                    saver.save(sess,"./model/cnn.model",global_step=step)
                    #break
                if acc > 0.9:
                    saver.save(sess,"./model/cnn.model",global_step=step)
                    break
            step += 1
#在main中调用
if __name__ == '__main__':
    isTrain = 1
    if 1 == isTrain:
        X = tf.placeholder(tf.float32,[None,200,150,1])
        Y = tf.placeholder(tf.float32,[None,4])
        
        keep_prob = tf.placeholder(tf.float32)
        train_cnn(xdata,ydata)

其他函数
get_next_batch_from_file函数的实现

def get_next_batch_from_file(batch_size = 128):    
    each_batch = batch_size // 4
    x_batch_data,y_batch_data = read_random_data('./f_a/data',each_batch,0)
    
    x,y = read_random_data('./f_b/data',each_batch,1)
    x_batch_data.extend(x)
    y_batch_data.extend(y)
    
    x,y = read_random_data('./m_a/data',each_batch,2)
    x_batch_data.extend(x)
    y_batch_data.extend(y)
    
    x,y = read_random_data('./m_b/data',each_batch,3)
    x_batch_data.extend(x)
    y_batch_data.extend(y)
    
    x_batch_data = np.array(x_batch_data,dtype = np.float32)
    y_batch_data = np.array(y_batch_data,dtype = np.float32)
    
    return x_batch_data,y_batch_data

def read_random_data(file_path,each_batch,t):
    flist = os.listdir(file_path)
    low = np.random.randint(len(flist))
    
    x_batch_file = None
    x_rdata = []
    y_rdata = []
    
    #print(low)
    if low + each_batch > len(flist) - 1:
        x_batch_file = flist[low:len(flist)]
        x_batch_file.extend(flist[:each_batch - len(flist) + low])
        #print(len(x_batch_file),'1',low,'=>',len(flist),'|','0=>',each_batch - len(flist) + low)
    else:       
        x_batch_file = flist[low:low + each_batch]
        #print(len(x_batch_file),'2')
    # read data
    for f in x_batch_file:
        img = cv2.imread(file_path+'/'+f)
        x_rdata.append(img)
        if 0 == t:
            y_rdata.append([1,0,0,0])
        if 1 == t:
            y_rdata.append([0,1,0,0])
        if 2 == t:
            y_rdata.append([0,0,1,0])
        if 3 == t:
            y_rdata.append([0,0,0,1])
    
    return x_rdata,y_rdata

这是训练好的模型，仅供参考：链接：https://pan.baidu.com/s/1uuzVMpG_PA_z8i77hS7wRA 密码：t7s6

站住这个领域

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
卷积神经网络简单的应用（二）：模型构建与训练

模型构建文中采用了Tensorflow框架进行模型的构建，这里简单介绍下Tensorflow的安装（在Anaconda上安装）：⑴Anaconda安装：https://www.anaconda.com/download/，选择支持py36的版本；⑵直接在命令行中安装Tensorflow：pip install tensorflow；⑶测试是否已经安装好Tensorflow：import tenso...
复制链接

扫一扫

专栏目录