博主好久没有更新了,以后继续坚持吧
第四章说到,深层神经网络,理解了一些基本概念,在第三章书中提到的模型是由线性的模型来实现的,被称为线性模型,因为当模型的输入只有一个的时候,输出的x和y为坐标系上的一条直线,类似的,当模型有n个输入的时候,也是在n维空间内的平面
在前面的介绍中的为:
a = xW(1), y=aW(2),其中x为输入,W为参数,也就相当于y = aW(1)W(2),在这里,所有的输入,输出,以及参数都是矩阵,都要用矩阵的乘法才能来实现整个关系。
在这里,为什么要讨论线性模型呢?因为要引出激活函数,由于线性模型具有很大的局限性,举个例子来说明问题吧
如下图:
这个图如果用线性模型来进行分类的话,就是用一条直线将两类的点分开,但是从图中我们可以明显的看出,这是不可能的。
因此需要激活函数(Activation),激活函数的加入,让原来是线性模型的东西变成了一个可以是非线性模型的东西,一般,除了加入Activation,还会加入biases(偏置项),tf提供了七种激活函数,常用的有tf.nn.relu, tf.nn.sigmoid, tf.nn.tanh,当