python版本的tensorflow-CNN的简易多分类

最新推荐文章于 2023-07-24 15:01:24 发布

Xuxixixixixixix

最新推荐文章于 2023-07-24 15:01:24 发布

阅读量2k

点赞数

分类专栏：人工智能文章标签： tensorflow cnn 分类 python

本文链接：https://blog.csdn.net/qq_16446137/article/details/100553534

版权

人工智能专栏收录该内容

3 篇文章 0 订阅

订阅专栏

首先还是推荐大家去tensorflow官网去看一下，或者中文社区的tensorflow官网
如何用Python搭建一个简易的多分类模型
首先大家得先安装上tensorflow，版本是1.4.1的，我用的Python版本是3.6的，高版本是潮流了，其他的配置包是anaconda3.6上的
假设我有个test.csv文件，这个文件是2706维度的，其中2704维度是特征，2维度为label，就是个二分了，多维就是多分的了，其实本来这个特征是3k多维，用来卡方检验之后特意减少到2706维，为了方便后面的网络搭建，

import tensorflow as tf
#这个是用于分开训练样本和测试样本的，也可以自己随机分开也可以
from sklearn import cross_validation
import pandas as pd

上面就是简单的导入一些包，这里我们只用到了这几个

pp = test.csv
#特征的列名为label0,label1，两维
data_label = pd.read_csv(pp)
X_train,X_test, y_train, y_test =\
    cross_validation.train_test_split(data_label.iloc[:,0:2704],data_label.iloc[:,2704:],test_size=0.2, random_state=0)
train = X_train.append(y_train)
test = X_test.append(y_test)

上面就是将测试集和训练集分开的，其实后面的append可以不用添加的，只是为了后面统一才这个处理了一下
下面直接上代码

#这里的定义可以省去with的会话模式，tensorflow上有介绍，这种sess的定义
sess=tf.InteractiveSession()
# 定义权重和偏置的初始化函数
def weight_varible(shape):
    initial=tf.truncated_normal(shape,stddev=0.2)#stddev表示标准差
    return tf.Variable(initial)
def bias_variable(shape):
    # 给偏置增加一些小的正值(0.1)
    initial=tf.constant(0.5,shape=shape)
    return tf.Variable(initial)
# 定义卷积层和池化层的初始化函数
def conv2d(x,W):
    return tf.nn.conv2d(x,W,strides=[1,1,1,1],padding='SAME')
def max_pool_2x2(x):
    return tf.nn.max_pool(x,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')
# 定义输入的placeholder，占位符
x=tf.placeholder(tf.float32,[None,2704])#特征
y_=tf.placeholder(tf.float32,[None,2])#train的label
W_conv1=weight_varible([5,5,1,32])
b_conv1=bias_variable([32])
h_conv1=tf.nn.relu(conv2d(x_image,W_conv1)+b_conv1) 
h_pool1=max_pool_2x2(h_conv1)#使用最大池化函数max_pool_2x2函数对卷积的输出结果进行池化操作
W_conv2=weight_varible([5,5,32,64]) 
b_conv2=bias_variable([64])
h_conv2=tf.nn.relu(conv2d(h_pool1,W_conv2)+b_conv2)
h_pool2=max_pool_2x2(h_conv2)
# 经过两次步长为2*2的最大池化，现在边长已经只有1/4了。这里就是52/4 方便取个整数的，实际应用时还应该理解卷积块的大小和strides 步长的定义和padding填充模式的定义
# 定义一个全连接层
W_fc1=weight_varible([13*13*64,1024])  # 全连接层隐含节点为1024个
b_fc1=bias_variable([1024])
h_pool2_flat=tf.reshape(h_pool2,[-1,13*13*64]) 
h_fc1=tf.nn.relu(tf.matmul(h_pool2_flat,W_fc1)+b_fc1)
# 为了减轻过拟合，下面使用一个dropout层
keep_prob=tf.placeholder(tf.float32)
h_fc1_drop=tf.nn.dropout(h_fc1,keep_prob)
# 将dropout层的输出连接一个softmax层，得到最后的概率输出
W_fc2=weight_varible([1024,2])
b_fc2=bias_variable([2])
y_conv=tf.nn.softmax(tf.matmul(h_fc1_drop,W_fc2)+b_fc2)
# 定义损失函数为cross entronpy，优化器使用Adam
cross_entropy=tf.reduce_mean(-tf.reduce_sum(y_*tf.log(y_conv),reduction_indices=[1]))
train_step=tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)  # 学习率为1e-4
# 定义评测准确率的操作
corret_prediction=tf.equal(tf.argmax(y_conv,1),tf.argmax(y_,1))
accuracy=tf.reduce_mean(tf.cast(corret_prediction,tf.float32))
# 开始训练过程
tf.global_variables_initializer().run()
#为了持久化操作加的，可以不加
#saver = tf.train.Saver()
#saver.save(sess, 'log/model.ckpt')
for i in range(20000):  # 进行20000次迭代训练
    # 初始化所有参数，设置dropout的keep_drop为0.5，这里用sample取batch的为50个每次
    batch=train.sample(n=50,replace = False)
    if i%100==0:  # 每进行100次训练，对准确率进行一次评测。评测时keep_prob设为1
        train_accuracy=accuracy.eval(feed_dict={x:batch.iloc[:,0:2704],y_:batch.iloc[:,2704:],keep_prob:1.0})
        print("step %d,training accurancy %g"%(i,train_accuracy))
    train_step.run(feed_dict={x:batch.iloc[:,0:2704],y_:batch.iloc[:,2704:],keep_prob:0.5})
print("accuracy %g"%accuracy.eval(feed_dict={x:test.iloc[:,0:2704],y_:test.iloc[:,2704:],keep_prob:1.0}))

其实内部的这些参数具体是多少需要自己简单了解一下CNN的卷积和池化操作，因为不用考虑反向传播误差的传递，这个其实就是一些加减乘除，
可以加入持久化操作，比较训练模型就是为了后续load用的，也可以加入TensorBoard，可视化流程还是挺不错的，本次模型比较简单，所有就没添加

Xuxixixixixixix

关注

0
点赞
踩
18

收藏

觉得还不错? 一键收藏
打赏
0
评论
python版本的tensorflow-CNN的简易多分类

首先还是推荐大家去tensorflow官网去看一下，或者中文社区的tensorflow官网如何用Python搭建一个简易的多分类模型首先大家得先安装上tensorflow，版本是1.4.1的，我用的Python版本是3.6的，高版本是潮流了，其他的配置包是anaconda3.6上的假设我有个test.csv文件，这个文件是2706维度的，其中2704维度是特征，2维度为label，就是个二分...
复制链接

扫一扫