读一篇人工智能cnn gps返回图像识别器代码注释以及流程图

最新推荐文章于 2024-04-20 23:52:02 发布

武凯的博客

最新推荐文章于 2024-04-20 23:52:02 发布

阅读量817

点赞数 2

文章标签：深度学习

本文链接：https://blog.csdn.net/qq_35415875/article/details/107118604

版权

1.代码

import dataset
import tensorflow as tf
import time
from datetime import timedelta
import math
import random
import numpy as np
# conda install --channel https://conda.anaconda.org/menpo opencv3
#Adding Seed so that random initialization is consistent

# 随机初始化：每一次随机都是相同的结果
from numpy.random import seed
seed(10) # 数值随意，不改变就行
from tensorflow import set_random_seed
set_random_seed(20)

# 每次迭代送入32张图
batch_size = 28
# 指定标签：只有两种
classes = ['island','seaice']
# 一共有多少类别，最后训练需要
num_classes = len(classes)

# 1000张图中，20%为测试集
validation_size = 0.2
# 由于图片有大有小，这里我设置/截所有图像为64x64
img_size = 64
# 彩色图：3通量
num_channels = 3
# 所有图像所在位置：training_data文件夹
train_path='training_data'

# 调用dataset.py中的read_train_sets函数
# 目的：得到已处理好、分好的图片集
data = dataset.read_train_sets(train_path, img_size, classes, validation_size=validation_size)

print("图片预处理完毕，分组如下：")
print("训练集张数:{}".format(len(data.train.labels)))
print("测试集张数:{}".format(len(data.valid.labels)))

session = tf.Session()
# 第一个参数是每次送入训练的张数；中间两个参数是图片的尺度：64x64；最后一个参数是3通量
x = tf.placeholder(tf.float32, shape=[None, img_size, img_size, num_channels], name='x')

# 标签数
y_true = tf.placeholder(tf.float32, shape=[None, num_classes], name='y_true')
# argmax判断当前哪个值大，就是什么
y_true_cls = tf.argmax(y_true, dimension=1)#y_true中每行最大原素的列坐标

# 卷积网络结构设置
filter_size_conv1 = 3 # 卷积核1是3x3
num_filters_conv1 = 32

filter_size_conv2 = 3#第一部分是输入层。第二部分由n个卷积层和池化层的组合组成。第三部分由一个全连结的多层感知机分类器构成。
num_filters_conv2 = 32

filter_size_conv3 = 3
num_filters_conv3 = 64

# 全连接层：1024个特征常见还有2048 4096等等
fc_layer_size = 1024

# 权重参数设置
def create_weights(shape):#创建w
return tf.Variable(tf.truncated_normal(shape, stddev=0.05))#产生截断正态分布随机数，取值范围为 [ mean - 2 * stddev, mean + 2 * stddev ]。

def create_biases(size):#创建b
return tf.Variable(tf.constant(0.05, shape=[size]))#创建常量，shape：表示张量的“形状”，即维数以及每一维的大小(猜测创建值为0.05的大小为size的一为张量）

# -------------------------------------------------------- #
# 辅助函数1：卷积池化各层参数的设置与工作
def create_convolutional_layer(input,
num_input_channels, #深度
conv_filter_size,
num_filters):

# 权重参数初始化：3 3 3 32
# 前两个参数是滑动窗尺寸3x3 第三个参数为3通量第4个参数是这一层观察多少个特征
weights = create_weights(shape=[conv_filter_size, conv_filter_size, num_input_channels, num_filters])#将要创建的卷积核的大小，深度，个数都传递给crearte_weights函数生成随机权重
biases = create_biases(num_filters)#b的个数核卷积核的个数一致

# 执行一次卷积操作
layer = tf.nn.conv2d(input=input,
filter=weights,
strides=[1, 1, 1, 1],
padding='SAME')#tf.nn.conv2d输入参数直接进行了卷积运算

layer += biases

# relu激活函数：激活后的数值传给下一步
layer = tf.nn.relu(layer)

# 池化操作：上一卷积层的输出就是这里的输入；池化窗尺寸为2x2
layer = tf.nn.max_pool(value=layer,
ksize=[1, 2, 2, 1],
strides=[1, 2, 2, 1],
padding='SAME')

# 一套卷积池化层工作完毕
return layer

# 辅助函数2：全连接层参数的设置
def create_flatten_layer(layer):
# 把到最后一个卷积池化层的尺寸：[7,8,8,64]#如果这个地方是1那后面7全改一即可，应该是1
# 既然是全连接层，就要把它拉伸；即对这个全连接层的"输入"应有8x8x64=4096个
layer_shape = layer.get_shape()#layer_shape = [7,8,8,64]

# 计算得到那个4096的数值
num_features = layer_shape[1:4].num_elements()#shape[1:4]切片数组得到[8,8,64]数组，num_elements()返回一个变量[8,8,64]的规模，也就是该变量的所有元素的数量。

# 转换成数组/矩阵
layer = tf.reshape(layer, [-1, num_features])#-1是不确定值，通过7*8*8*64/8*8*64计算得出7#目前理解7是指七页

return layer

# 辅助函数3：全连接层创建与工作
def create_fc_layer(input,#7*4096 #7*1024
num_inputs,# 8*8*64 = 4096 #1024
num_outputs,#1024 #2
use_relu=True):

# 全连接层的权重参数等的设置：前4096，后2048（自己之前设置过的）
weights = create_weights(shape=[num_inputs, num_outputs])#4096*1024#1024*2
biases = create_biases(num_outputs)#1024#2

# 计算：
layer = tf.matmul(input, weights) + biases#矩阵7*4096和4096*1024的到7*1024#7*1024和1024*2得到7*2（即七张图每张图俩类别的概率）

# dropout解决过拟合，随机杀死30%个节点
layer=tf.nn.dropout(layer,keep_prob=0.7)

# relu激活函数
if use_relu:
layer = tf.nn.relu(layer)
return layer
# -------------------------------------------------------- #

# 调用辅助函数1：第一套 “卷积池化层” 工作完毕
layer_conv1 = create_convolutional_layer(input=x,#x第47行shape=NONE
num_input_channels=num_channels,
conv_filter_size=filter_size_conv1,
num_filters=num_filters_conv1)

# 调用辅助函数1：第二套 “卷积池化层” 工作完毕
layer_conv2 = create_convolutional_layer(input=layer_conv1,
num_input_channels=num_filters_conv1,
conv_filter_size=filter_size_conv2,
num_filters=num_filters_conv2)

# 调用辅助函数1：第三套 “卷积池化层” 工作完毕
layer_conv3= create_convolutional_layer(input=layer_conv2,
num_input_channels=num_filters_conv2,
conv_filter_size=filter_size_conv3,
num_filters=num_filters_conv3)

# 调用辅助函数2：对下面的全连接层先设置相关的参数
layer_flat = create_flatten_layer(layer_conv3)

# 调用辅助函数3：全连接层1工作
layer_fc1 = create_fc_layer(input=layer_flat,
num_inputs=layer_flat.get_shape()[1:4].num_elements(),#
num_outputs=fc_layer_size,
use_relu=True)

# 调用辅助函数3：全连接层2工作
layer_fc2 = create_fc_layer(input=layer_fc1,
num_inputs=fc_layer_size,#1024
num_outputs=num_classes,#2
use_relu=False)

# 预测值：谁大选谁
y_pred = tf.nn.softmax(layer_fc2,name='y_pred')
#softmax的输出向量，就是概率，该样本属于各个类的概率#softmax后为tensor
y_pred_cls = tf.argmax(y_pred, dimension=1)#取行最大的
#这俩步作者为了打印与梯度下降操作无关

# 以下是常规操作：
session.run(tf.global_variables_initializer())# 必须要使用global_variables_initializer的场合
# 含有tf.Variable的环境下，因为tf中建立的变量是没有初始化的，也就是在debug时还不是一个tensor量，而是一个Variable变量类型
#简单来说初始化所有张量
cross_entropy = tf.nn.softmax_cross_entropy_with_logits(logits=layer_fc2, labels=y_true)#
#第一个参数logits：就是神经网络最后一层的输出，如果有batch的话，它的大小就是[batchsize，num_classes]，单样本的话，大小就是num_classes
#第二个参数labels：实际的标签，大小同上
#体的执行流程大概分为两步：
#第一步是先对网络最后一层的输出做一个softmax，
#这一步通常是求取输出属于某一类的概率，对于单样本而言，输出就是一个num_classes大小的向量（[Y1，Y2,Y3...]其中Y1，Y2，Y3...分别代表了是属于该类的概率）
#第二步是softmax的输出向量[Y1，Y2,Y3...]和样本的实际标签做一个交叉熵

cost = tf.reduce_mean(cross_entropy)#结合上一步求loss#求损失值
#前三步为了最后一步优化器
optimizer = tf.train.AdamOptimizer(learning_rate=1e-4).minimize(cost)#tf.train.AdamOptimizer()函数是Adam优化算法：
#是一个寻找全局最优点的优化算法，引入了二次方梯度校正。#学习率1e-4#
#梯度下降函数，优化器就会按照循环的次数一次次沿着loss最小值的方向优化参数了。
#train_step = tf.train.GradientDescentOptimizer(0.2).minimize(loss)
#优化器# train_step = tf.train.AdamOptimizer(0.001)
#收敛速度比较快# train_step = tf.train.AdamOptimizer(1e-3).minimize(loss) #10的-3次方,学习率，
#此步骤定义好优化器
correct_prediction = tf.equal(y_pred_cls, y_true_cls)#判断预测和实际是否一致
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))#tf.cast将预测结果转换为float32后的张量的平均值
#也可以看成准确率

session.run(tf.global_variables_initializer())

# 打印：
def show_progress(epoch, feed_dict_train, feed_dict_validate, val_loss,i):
acc = session.run(accuracy, feed_dict=feed_dict_train)
val_acc = session.run(accuracy, feed_dict=feed_dict_validate)
msg = "Training Epoch {0}--- iterations: {1}--- 训练集精度: {2:>6.1%}, 测试集精度: {3:>6.1%}, 测试集损失值: {4:.3f}"
print(msg.format(epoch + 1,i, acc, val_acc, val_loss))
ftmp.write(msg.format(epoch + 1,i, acc, val_acc, val_loss))
ftmp.write('\n')
ftmp.flush()

# 从第0次开始迭代
total_iterations = 0

# 跑模型 + 模型保存：
ftmp = open('result.txt','w')
saver = tf.train.Saver()
def train(num_iteration):
global total_iterations

for i in range(total_iterations,
total_iterations + num_iteration):

# 调用dataset.py文件中data类中的next_batch方法
x_batch, y_true_batch, _, cls_batch = data.train.next_batch(batch_size)#batch_size ==28
x_valid_batch, y_valid_batch, _, valid_cls_batch = data.valid.next_batch(batch_size)#每次迭代返回该段batch的
#images图片数据（矩阵） labels每张图片对应标签 img_names图片名字 cls每遍历一张图片就记录该图片类别的列表
# 做好每一个epoch
feed_dict_tr = {x: x_batch, y_true: y_true_batch}
feed_dict_val = {x: x_valid_batch, y_true: y_valid_batch}

# 开始运行训练
session.run(optimizer, feed_dict=feed_dict_tr)#我们在编写代码的时候，总是要先定义好整个图，然后才调用sess.run()。
#feed_dict参数的作用是替换图中的某个tensor的值或设置graph的输入值。
       #相当于定义好了张量a和b以及操作（，这一步执行。
       # 打印：
if i % int(data.train.num_examples/batch_size) == 0:
# 损失值
val_loss = session.run(cost, feed_dict=feed_dict_val)
epoch = int(i / int(data.train.num_examples/batch_size))

show_progress(epoch, feed_dict_tr, feed_dict_val, val_loss,i)
# 保存文件夹的地方
saver.save(session, './model/island-seaice.ckpt',global_step=i)

total_iterations += num_iteration

# 调用train函数：规定一共迭代4000次
train(num_iteration=4000)

2.详细流程图

源码：

链接：https://pan.baidu.com/s/1NyNoIqXJ7bg_X-ZW4UFhug
提取码：7krh
复制这段内容后打开百度网盘手机App，操作更方便哦

武凯的博客

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
读一篇人工智能cnn gps返回图像识别器代码注释以及流程图

1.代码 import datasetimport tensorflow as tfimport timefrom datetime import timedeltaimport mathimport randomimport numpy as np# conda install --channel https://conda.anaconda.org/menpo opencv3#Adding Seed so that random initialization is consiste.
复制链接

扫一扫