从0实现三层神经网络

最新推荐文章于 2023-09-11 19:42:31 发布

FibonacciCode

最新推荐文章于 2023-09-11 19:42:31 发布

阅读量110

点赞数

分类专栏：深度学习算法

本文链接：https://blog.csdn.net/yuebowhu/article/details/109560989

版权

深度学习算法专栏收录该内容

18 篇文章 2 订阅

订阅专栏

本文目标

分享李沐老师关于深度学习的观点：1⃣️从实践的角度入手深度学习可能比单纯的研究算法更好；2⃣️如果想学习深度学习，要只用简单的数据结构，譬如numpy、NDArray，从0实现一个深度学习算法，这样才能碰到进而解决深度学习中的许多核心问题，也可以更好的理解现在流行的框架；3⃣️从应用的角度，那就直接上现成的框架，结合真实数据不断练习，调得一手好参；
结合李航《统计学习方法》中的观点，总结出机器学习（深度学习）的一般代码框架，具体看代码。

机器学习的一般框架

从0实现版

# -*- coding: utf-8 -*-
import d2lzh as d2l
from mxnet import nd
from mxnet import autograd

# data
batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

# model
num_inputs, num_hiddens1, num_hiddens2, num_outputs = 784, 256, 256, 10
W1 = nd.random.normal(scale=0.01, shape=(num_inputs, num_hiddens1))
b1 = nd.zeros(num_hiddens1)
W2 = nd.random.normal(scale=0.01, shape=(num_hiddens1, num_hiddens2))
b2 = nd.zeros(num_hiddens2)
W3 = nd.random.normal(scale=0.01, shape=(num_hiddens2, num_outputs))
b3 = nd.zeros(num_outputs)
params = [W1, b1, W2, b2, W3, b3]

for param in params:
    param.attach_grad()


def relu(X):
    return nd.maximum(X, 0)


def softmax(X):
    X_exp = X.exp()
    partition = X_exp.sum(axis=1, keepdims=True)
    return X_exp / partition


def net(X):
    X = X.reshape((-1, num_inputs))
    H1 = relu(nd.dot(X, W1) + b1)
    H2 = relu(nd.dot(H1, W2) + b2)
    return softmax(H2)


# strategy
def cross_entropy(y_hat, y):
    return -nd.pick(y_hat, y).log()


loss = cross_entropy


# algorithm
def sgd(params, lr, batch_size):
    for param in params:
        param[:] = param - lr * param.grad / batch_size


# training
def evaluate_accuracy(data_iter, net):
    acc_sum, n = 0.0, 0
    for X, y in data_iter:
        y = y.astype('float32')
        acc_sum += (net(X).argmax(axis=1) == y).sum().asscalar()
        n += y.size
    return acc_sum / n


def train(net, train_iter, test_iter, loss, num_epochs, batch_size, params, lr):
    for epoch in range(num_epochs):
        train_l_sum, train_acc_sum, n = 0.0, 0.0, 0
        for X, y in train_iter:
            with autograd.record():
                y_hat = net(X)
                l = loss(y_hat, y).sum()
            l.backward()
            sgd(params, lr, batch_size)
            y = y.astype('float32')
            train_l_sum += l.asscalar()
            train_acc_sum += (y_hat.argmax(axis=1) == y).sum().asscalar()
            n += y.size
        test_acc = evaluate_accuracy(test_iter, net)
        print('epoch: %d, loss %.4f, train_acc %.3f, test_acc %.3f'
              % (epoch + 1, train_l_sum / n, train_acc_sum / n, test_acc))


num_epochs, lr = 10, 0.3
train(net, train_iter, test_iter, loss, num_epochs, batch_size,
      params, lr)
# predict

if __name__ == '__main__':
    print('------ok-------')

说明：代码中还是使用了d2l.load_data_fashion_mnist来加载图片数据，有时间把这个也替换掉，用NDArray实现；

mxnet框架版

# -*- coding: utf- -*-
import d2lzh as d2l
from mxnet import gluon, init
from mxnet.gluon import loss as gloss, nn

# data
batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

# model
net = nn.Sequential()
net.add(nn.Dense(256, activation='relu'),
        nn.Dense(256, activation='relu'),
        nn.Dense(10))
net.initialize(init.Normal(sigma=0.01))

# strategy
loss = gloss.SoftmaxCrossEntropyLoss()

# algorithm
lr = 0.3
trainer = gluon.Trainer(net.collect_params(), 'sgd', {'learning_rate': lr})

# training
num_epochs = 10
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, batch_size, None, None, trainer)
# predict

if __name__ == '__main__':
    print('-----ok------')

参考资料

FibonacciCode

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
从0实现三层神经网络

本文目标分享李沐老师关于深度学习的观点：1⃣️从实践的角度入手深度学习可能比单纯的研究算法更好；2⃣️如果想学习深度学习，要只用简单的数据结构，譬如numpy、NDArray，从0实现一个深度学习算法，这样才能碰到进而解决深度学习中的许多核心问题，也可以更好的理解现在流行的框架；3⃣️从应用的角度，那就直接上现成的框架，结合真实数据不断练习，调得一手好参；结合李航《统计学习方法》中的观点，总结出机器学习（深度学习）的一般代码框架，具体看代码。机器学习的一般框架从0实现版# -*- coding
复制链接

扫一扫