一动机:想学习深度学习算法,之前已经看过Andrew NG的课程,听完之后感觉原理也不是很难,于是萌生了上手试一把的冲动,最开始用了TensorFlow,感觉很神奇的几段代码就达成了,然而用TensorFlow感觉还是很黑盒的感觉,还是想用Python手动撸一把,于是就上手试一下。
二方法:基本原理其实不是很复杂,照着线性回归,改成sigmoid的函数就可以了,超过两个用softmax,Cost函数变化了,不过权重更新貌似挺像的。(原理笔记见这里https://blog.csdn.net/mysql403/article/details/51246822)
三过程:
1 数据下载,直接从tensorflow里面读取,
import tensorflow.examples.tutorials.mnist.input_data
mnist = input_data.read_data_sets('data/', one_hot=True)
读取到的数据有train(55000)和test(10000)两个数据集 分别有images(784,1)和labels(10,1)两项,
2 原理虽然不难撸代码还真不简单呀,(x,y)(x_,y_),w,b分别是什么样的矩阵,如何乘这些细节都要考虑。考虑完之后,训练样本要