机器学习入门的时候,看吴恩达的视频,会有一个手写数字识别的作业,当时是用octave实现了核心的部分,之后了解了tensorflow,发现实现一个手写数字识别系统简直不要太简单,当时看的是这篇博客 ,清晰易懂。在此自己理清一下思路。注:代码参考这个博客
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("G:/tensorflow/data", one_hot=True)
这两句是直接使用tensorflow中的模块,input_data 直接导入数据到项目中,第一个参数给定下载数据到目标目录,one_hot参数指将数据转成one_hot形式,如手写数字是0-9,若为0 ,则转为10维数据[1,0,0,0,0,0,0,0,0,0]。
import tensorflow as tf
learning_rate = 0.001
train_epochs = 20
batch_size = 64
要使用tensorflow, 首先要引入它,然后应该初始化一个图,但是tensorflow中会默认一个图graph,所以可以跳过。此处设置学习速率为0.001,即模型优化时,采用的梯度下降方法,以0.001的学习速率向最优点逼近。train_epochs是指训练的轮数,每次训练选取batch_size组数据,每轮可以训练 mnist.train.num_examples / batch_size次。所以这是一个随机梯度下降(SGD)。
n_input = 784
n_hidden1 = 100
n_hidden2 = 100
n_classes