人工神经网络ANN学习笔记（一）

最新推荐文章于 2025-03-21 09:23:58 发布

努力学习的小白同学

最新推荐文章于 2025-03-21 09:23:58 发布

阅读量1.4k

点赞数 3

文章标签：神经网络

本文链接：https://blog.csdn.net/qq_45126707/article/details/120551817

版权

本文详细介绍了人工神经网络的基本概念，以MNIST数据集为例，涵盖了输入层、隐藏层、权重初始化、激活函数（如sigmoid、ReLU和Softmax）、损失函数（平方误差损失）以及模型评估指标（混淆矩阵、准确率、精确率和召回率）。着重讲解了如何使用这些工具进行前向传播和反向传播，以及权重向量的几种初始化策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

定义：人工神经网络（Artificial Neural Network），它是人脑神经元网络的抽象，是一种运算模型，由大量的节点（或称神经元）相互联接构成。每个节点代表一种特定的输出函数，称为激活函数。每两个节点间的连接都代表一个对于通过该连接信号的加权值，称之为权重。网络的输出则依网络的连接方式，权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近，也可能是对一种逻辑策略的表达。

注：1.样本有多少个feature，输入层就有多少个节点。

2.根据组合的情况来设定权重，权重要进行初始化。

下面以手写体数字识别为例继续学习ANN

数据集简介：MNIST数据集，60000个样本用于学习，10000个样本用于测试，每一个样本都是28*28点阵图，共784个像素点，每个像素点的值从0-255。每个样本的784个像素点的值就是feature，每个样本的数字就是label。

从输入到输出的过程叫做前向传播（forward propagation），输入层有784个节点，隐藏层根据需要自己设置，每个节点的输入值乘以对应的权重的和送入激活函数，依此类推。输出可以设置一个节点，输出0-9这十个类别；也可以设置十个节点，输出一种概率分布，比如0.8的概率为“0”，0.1的概率是“6”，0.05的概率是“8”……

当输出值和目标值之间有差距时，就定义了一个损失函数（cost function），将损失返回回去，来寻找一个新的权重的组合，再算一遍输出，使其更接近目标值，这个过程就叫做反向传播(back propagation)。

如何初始化权重向量

1.生成半开区间上的均匀分布

##生成1000个从-1到0区间上的均匀分布
import numpy as np

mumber_of_samples = 1000
low = -1
high = 0
s = np.random(low, high, number_of_samples)

2.生成二项式分布

##100次试验，每次成功的概率为0.5
import numpy as np

s = np.random.binomial(100, 0.5, 1000)

3.numpy.random.normal不能指定区间值，引入scipy.stats.truncnorm

import numpy as np

def truncated_normal(mean=0, as=1, low=0, upp=10):
    return truncnorm(
                     (low - mean) / sd, (upp - mean) / ad, loc=mean, scale=sd)

no_of_input_nodes = 3
no_of_hidden_nodes = 4
rad = 1 / np.sqrt (no_of_input_nodes)

X = truncated_normal (mean=2, sd=1, low=-rad, upp=rad)
wih = X.rvs((no_of_hidden_nodes, no_of_input_nodes))

激活函数(activation function)

$Z=W^TX+b$ 只能对输入值进行线性处理，引入激活函数就可以进行非线性处理了，这样神经网络就可以应用到众多的非线性模型中。下面是几种激活函数：