手撕神经网络：从零开始实现一个简单的神经网络（python）

最新推荐文章于 2025-06-29 16:45:43 发布

原创

最新推荐文章于 2025-06-29 16:45:43 发布 · 2.3k 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#从零 #神经网络 #python #代码 #实现

本文介绍如何从零开始用Python实现一个简单的全连接神经网络，用于二分类任务。通过理解网络结构、前向传播、反向传播以及优化算法，加深对神经网络工作原理的认识。代码实现基于IPython，使用tanh激活函数和全批量梯度下降优化。

手撕神经网络：从零开始实现一个简单的神经网络

1. 前言

现在有很多深度学习平台可以用，甚至我们根本不需要知道网络背后是怎么运行的，就可以训练出我们想要的模型，但是从学习的角度，从零开始写一个简单的神经网络是有必要的，它将有助于理解神经网络的工作原理。

之前有写过基于 TF 的全连接神经网络的实现，可以参考深度学习笔记——全连接神经网络样例程序及详细注释。但是这里将不借助任何深度学习平台来实现一个全连接神经网络，并用这个网络来实现分类任务。

本篇文章主要参考 Implementing a Neural Network from Scratch in Python – An Introduction。

另外如果你想实现一个卷积神经网络，可以参考 CNN-from-Scratch。

2. 网络结构

网络的结构很简单，如下图所示，两层全连接神经网络，激活函数为 $t a n h$ 。优化算法为 full batch SGD，没有加 momentum，关于优化算法可以参考深度学习中常用的优化算法(SGD, Nesterov,Adagrad,RMSProp,Adam)总结。参数初始化方式选用最简单的随机初始化。

在这里插入图片描述

用这个网络解决一个二分类问题，数据直接借助 sklearn 生成，借助 matplotlib 来可视化分类的结果。整个代码用 python（ipython）实现。

整个网络的前向传播过程如下：

$\begin{aligned} z_1 & = xW_1 + b_1 \\ a_1 & = \tanh(z_1) = \frac{e^{z_1} - e^{-{z_1}}}{e^{z_1} + e^{-{z_1}}} \\ z_2 & = a_1W_2 + b_2 \\ \hat{y} & = a_2 = \mathrm{softmax}(z_2) \end{aligned}$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。