神经网络回归原理详解及Python代码示例

最新推荐文章于 2024-07-22 17:32:39 发布

wodertianna

最新推荐文章于 2024-07-22 17:32:39 发布

阅读量1.4k

点赞数 51

文章标签：神经网络回归 python

本文链接：https://blog.csdn.net/wodertianna/article/details/139907461

版权

神经网络回归原理详解

神经网络回归（Neural Network Regression）是一种使用神经网络来解决回归问题的方法。神经网络是一类模仿人脑神经元连接模式的算法，能够捕捉复杂的非线性关系。神经网络回归通过一系列神经元层（层）对输入数据进行处理，最终输出连续值。

1. 神经网络的基本结构

神经网络由多个层组成，包括输入层、隐藏层和输出层。每一层由若干神经元组成，神经元之间通过带有权重的连接进行信息传递。

输入层：接收输入数据，每个神经元对应一个特征。
隐藏层：通过激活函数对输入数据进行非线性变换，通常包含多个层次。
输出层：输出预测值，对应于回归问题中的连续目标值。

2. 前向传播

在前向传播过程中，输入数据依次通过每一层的神经元进行计算，经过激活函数处理后传递到下一层，最终输出预测值。计算过程涉及输入与权重的加权和，再通过激活函数进行非线性变换。

3. 损失函数

神经网络回归的损失函数用于衡量预测值与真实值之间的差异，常用的损失函数是均方误差（MSE），它计算预测值与真实值之间差的平方和的平均值。

4. 反向传播

反向传播算法用于更新神经网络的权重。它通过计算损失函数相对于每个权重的梯度，并按照梯度下降的方法调整权重，以最小化损失函数。

5. 优化算法

常用的优化算法包括随机梯度下降（SGD）、Adam等，这些算法通过不断调整权重来优化神经网络的性能。

Python代码示例

以下是一个完整的Python代码示例，用于实现神经网络回归。我们将使用tensorflow和keras库来构建和训练模型。

import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.optimizers import Adam

# 生成一些示例数据
np.random.seed(0)
x = np.sort(5 * np.random.rand(100, 1), axis=0)
y = np.sin(x).ravel()
y[::5] += 3 * (0.5 - np.random.rand(20))  # 添加噪声

# 可视化原始数据
plt.scatter(x, y, s=20, edgecolor="black", c="darkorange", label="data")
plt.title("Original Data")
plt.show()

# 数据标准化
scaler = StandardScaler()
x_scaled = scaler.fit_transform(x)

# 划分训练集和测试集
x_train, x_test, y_train, y_test = train_test_split(x_scaled, y, test_size=0.2, random_state=42)

# 创建神经网络模型
model = Sequential()
model.add(Dense(10, input_dim=1, activation='relu'))
model.add(Dense(10, activation='relu'))
model.add(Dense(1, activation='linear'))

# 编译模型
model.compile(optimizer=Adam(learning_rate=0.01), loss='mean_squared_error')

# 训练模型
history = model.fit(x_train, y_train, epochs=100, batch_size=10, validation_split=0.2, verbose=0)

# 预测结果
y_train_pred = model.predict(x_train)
y_test_pred = model.predict(x_test)

# 可视化训练过程
plt.plot(history.history['loss'], label='train loss')
plt.plot(history.history['val_loss'], label='val loss')
plt.title('Model Loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()
plt.show()

# 可视化拟合结果
x_test_sorted = np.sort(x_test, axis=0)
y_test_pred_sorted = model.predict(x_test_sorted)

plt.figure()
plt.scatter(x_train, y_train, s=20, edgecolor="black", c="darkorange", label="train data")
plt.scatter(x_test, y_test, s=20, edgecolor="black", c="blue", label="test data")
plt.plot(x_test_sorted, y_test_pred_sorted, color="green", label="predictions", linewidth=2)
plt.title("Neural Network Regression")
plt.legend()
plt.show()

# 打印模型参数和均方误差
train_mse = model.evaluate(x_train, y_train, verbose=0)
test_mse = model.evaluate(x_test, y_test, verbose=0)
print("Train Mean Squared Error:", train_mse)
print("Test Mean Squared Error:", test_mse)

代码解释

数据生成：
- 生成100个随机点，并将这些点排序。
- 使用正弦函数生成目标值，并在部分数据上添加随机噪声以增加数据的复杂性。
数据可视化：
- 绘制生成的原始数据点，用散点图表示。
数据标准化：
- 使用StandardScaler对数据进行标准化处理，以使得输入特征具有零均值和单位方差。
数据划分：
- 将数据划分为训练集和测试集，训练集占80%，测试集占20%。
创建神经网络模型：
- 使用Sequential类创建一个神经网络模型。
- 添加输入层和两个隐藏层，每层包含10个神经元，激活函数为ReLU。
- 添加输出层，包含1个神经元，激活函数为线性函数。
编译模型：
- 使用Adam优化器，学习率为0.01，损失函数为均方误差。
训练模型：
- 在训练数据上训练模型，设置训练轮数为100，批次大小为10，并划分20%的数据用于验证。
预测结果：
- 在训练集和测试集上进行预测，生成预测结果。
可视化训练过程：
- 绘制训练损失和验证损失随训练轮数的变化曲线。
可视化拟合结果：
- 绘制训练数据、测试数据及模型的预测结果，观察模型的拟合效果。
模型评估：
- 计算并打印训练集和测试集的均方误差（MSE），评估模型的拟合性能。