numpy实现简单神经网络

最新推荐文章于 2024-08-09 22:24:25 发布

m0_50528247

最新推荐文章于 2024-08-09 22:24:25 发布

阅读量138

点赞数 2

文章标签： numpy 神经网络人工智能

本文链接：https://blog.csdn.net/m0_50528247/article/details/139723466

版权

一个全连接的 ReLU 神经网络，一个隐藏层，没有 bias，用来从 x 预测 y。

题目要求：

用 numpy 实现两层神经网络拟合。
两层线性层:
h = W1 * x
h_relu = relu(h)
y = W2 * x
优化方法使用随机梯度下降（SGD）
Loss 函数使用均方误差函数（MSE）

代码实现：

import numpy as np

EPOCH = 500
LEARNING_RATE = 1e-6
N, D_in, H, D_out = 64, 1000, 100, 10
X=np.random.randn(N,D_in)
y=np.random.randn(N,D_out)
w1=np.random.randn(D_in,H)
w2=np.random.randn(H,D_out)

#激活函数
def relu(x):
    return np.maximum(0,x)

#损失函数(均方差MSE)
def loss_function(y_pred,y):
    result = np.subtract(y,y_pred)#求差
    result = np.power(result, 2)#差的平方
    result = np.mean(result)
    return result

#求梯度(求导)
def grad(x,y,w1,w2):
    h = np.dot(x, w1)
    h_relu = relu(h)
    y_pred = np.dot(h_relu, w2)

    #L=(R.dot(w2)-y)^2,R=u if u>0 else 0 ,u=X.dot(w1)
    #求对w2的偏导数
    diff=-2*(y-y_pred)#最外层求导
    dw2=h_relu.T.dot(diff)

    #求对w1的偏导数
    dh_relu=diff.dot(w2.T)#L对R求导 dL/dR=diff*w2
    dh = dh_relu.copy()
    dh[h<0]=0#u>0 dR/du=1; u<=0 dR/du=0
    #du/dw1=X
    #dL/dw1= dL/dR * dR/du *du/dw1
    dw1=x.T.dot(dh)
    return dw1,dw2


for i in range(EPOCH):
    #前向传播
    #输入层-》隐含层
    h=np.dot(X,w1)
    h_relu=relu(h)
    #隐含层-》输出层
    y_pred=np.dot(h_relu,w2)

    #计算损失（误差）
    loss=loss_function(y_pred,y)
    if i%50==0:
        print('epoch:',i,'loss:',loss)

    #反向传播，优化方法（SGD）
    for i in range(N):
        index=np.random.randint(N)
        xi=X[index:index+1]
        yi=y[index:index+1]
        #求导
        dw1,dw2=grad(xi,yi,w1,w2)
        #更新权重
        w1=w1-LEARNING_RATE*dw1
        w2=w2-LEARNING_RATE*dw2

print("y:",y)
print("pred_y",y_pred)