16. 关于正则化的介绍

        正则化是一种用于机器学习和统计建模的技术,旨在防止模型过拟合训练数据,提高模型的泛化能力。过拟合是指模型在训练数据上表现得很好,但在未见过的测试数据上表现糟糕的情况。正则化通过向模型的损失函数中添加额外的项,惩罚模型的复杂性,以减少模型对训练数据的过度拟合

常见的正则化方法包括L1正则化(Lasso正则化)和L2正则化(Ridge正则化)。

1 L1正则化
  • 公式:损失函数 + λ * Σ|wi| 
    • 其中:
      • λ(lambda)是正则化强度参数,用于控制正则化的程度。
      • wi是模型的权重参数。
  • 描述:在损失函数中添加了权重的绝对值之和,其中λ是正则化强度参数,wi是模型的权重。L1正则化倾向于使一些权重变为零,从而使模型更稀疏,减少不相关特征的影响。
2 L2正则化:
  • 公式:损失函数 + λ * Σ(wi^2)
    • 其中

      • λ(lambda)是正则化强度参数,用于控制正则化的程度。
      • wi是模型的权重参数。
  • 描述:在损失函数中添加了权重的平方和,其中λ是正则化强度参数ÿ
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
很高兴回答你的问题!这是一道比较全面的题目,需要结合多个知识点,包括数据读取、数据预处理、模型搭建、模型训练、模型预测以及结果评估等。下面我将分步骤为您详细介绍。 首先,我们需要导入所需的模块。本次使用的模块包括 pandas、numpy、sklearn 和 keras。您可以通过 pip install pandas numpy sklearn keras 命令来安装。 ```python import pandas as pd import numpy as np from sklearn.model_selection import train_test_split from sklearn.metrics import r2_score, mean_absolute_error, mean_squared_error from keras.models import Sequential from keras.layers import Dense from keras.optimizers import SGD from keras.initializers import glorot_uniform from keras.regularizers import l2 from keras.utils.vis_utils import plot_model import matplotlib.pyplot as plt ``` 接着,我们可以通过 pandas 的 read_excel 方法读取数据,并对数据进行预处理。根据题目要求,我们需要将第 2 行至第 3001 行作为训练集,之后的数据作为测试集,并且需要将输入数据和输出数据分开处理。同时,我们需要对输入数据进行归一化处理,以便更好地训练模型。 ```python # 读取数据 data = pd.read_excel('NEW.xlsx') # 提取训练集和测试集 train_data = data.iloc[1:3001, [9, 10, 11, 12, 13, 14, 16, 17, -2]] test_data = data.iloc[3001:, [9, 10, 11, 12, 13, 14, 16, 17, -2]] # 分离输入和输出 train_X = train_data.iloc[:, :-1].values train_Y = train_data.iloc[:, -1].values test_X = test_data.iloc[:, :-1].values test_Y = test_data.iloc[:, -1].values # 对输入数据进行归一化处理 mean = train_X.mean(axis=0) std = train_X.std(axis=0) train_X = (train_X - mean) / std test_X = (test_X - mean) / std ``` 接着,我们可以开始搭建神经网络模型了。根据题目要求,我们需要使用 Xavier 初始化、L2 正则化和 MSGD 优化方法。我们将使用 Keras 库来实现神经网络模型。 ```python model = Sequential() model.add(Dense(units=8, input_dim=8, kernel_initializer=glorot_uniform(seed=0), kernel_regularizer=l2(0.01), activation='relu')) model.add(Dense(units=1, kernel_initializer=glorot_uniform(seed=0))) sgd = SGD(lr=0.01) model.compile(loss='mean_squared_error', optimizer=sgd) ``` 接着,我们可以开始训练神经网络模型了。根据题目要求,我们需要使用训练集进行训练,同时记录模型的拟合度。在训练完成后,我们将使用训练好的模型对测试集进行预测,并记录预测结果。 ```python history = model.fit(train_X, train_Y, epochs=100, batch_size=32, verbose=0) train_predict = model.predict(train_X) test_predict = model.predict(test_X) ``` 接下来,我们可以评估模型的拟合度,并输出 MAE、MSE、预测值和真实值之间的相对误差平均百分比。同时,我们可以绘制 R2 图和各输入输出的拟合折线图。 ```python # 输出模型拟合度 print('Train R2 score:', r2_score(train_Y, train_predict)) print('Test R2 score:', r2_score(test_Y, test_predict)) # 输出 MAE、MSE 以及相对误差平均百分比 print('MAE:', mean_absolute_error(test_Y, test_predict)) print('MSE:', mean_squared_error(test_Y, test_predict)) print('Relative error:', np.mean(np.abs(test_predict - test_Y) / test_Y) * 100, '%') # 绘制 R2 图 plt.scatter(train_Y, train_predict, label='Train') plt.scatter(test_Y, test_predict, label='Test') plt.plot([min(train_Y + test_Y), max(train_Y + test_Y)], [min(train_Y + test_Y), max(train_Y + test_Y)], 'k--') plt.xlabel('True values') plt.ylabel('Predicted values') plt.title('R2: Train=%.3f, Test=%.3f' % (r2_score(train_Y, train_predict), r2_score(test_Y, test_predict))) plt.legend() plt.show() # 绘制各输入输出的拟合折线图 for i in range(train_X.shape[1]): plt.figure(figsize=(8, 6)) plt.scatter(train_X[:, i], train_Y, label='Train') plt.scatter(test_X[:, i], test_Y, label='Test') plt.plot(sorted(train_X[:, i]), model.predict(np.sort(train_X[:, i].reshape(-1, 1))), 'r--', label='Fitting curve') plt.xlabel('Input ' + str(i + 1)) plt.ylabel('Output') plt.title('Fitting curve of Input ' + str(i + 1) + ': R2=%.3f' % r2_score(test_Y, test_predict)) plt.legend() plt.show() ``` 最后,我们需要将 BPNN.py 和 main.py 两个模块整合起来。BPNN.py 模块负责搭建神经网络模型,而 main.py 模块负责读取数据、进行数据预处理、训练模型、预测结果和评估模型拟合度,并输出相应的结果和图表。 BPNN.py: ```python from keras.models import Sequential from keras.layers import Dense from keras.optimizers import SGD from keras.initializers import glorot_uniform from keras.regularizers import l2 def build_model(): model = Sequential() model.add(Dense(units=8, input_dim=8, kernel_initializer=glorot_uniform(seed=0), kernel_regularizer=l2(0.01), activation='relu')) model.add(Dense(units=1, kernel_initializer=glorot_uniform(seed=0))) sgd = SGD(lr=0.01) model.compile(loss='mean_squared_error', optimizer=sgd) return model ``` main.py: ```python import pandas as pd import numpy as np from sklearn.model_selection import train_test_split from sklearn.metrics import r2_score, mean_absolute_error, mean_squared_error from keras.utils.vis_utils import plot_model import matplotlib.pyplot as plt from BPNN import build_model # 读取数据 data = pd.read_excel('NEW.xlsx') # 提取训练集和测试集 train_data = data.iloc[1:3001, [9, 10, 11, 12, 13, 14, 16, 17, -2]] test_data = data.iloc[3001:, [9, 10, 11, 12, 13, 14, 16, 17, -2]] # 分离输入和输出 train_X = train_data.iloc[:, :-1].values train_Y = train_data.iloc[:, -1].values test_X = test_data.iloc[:, :-1].values test_Y = test_data.iloc[:, -1].values # 对输入数据进行归一化处理 mean = train_X.mean(axis=0) std = train_X.std(axis=0) train_X = (train_X - mean) / std test_X = (test_X - mean) / std # 搭建神经网络模型 model = build_model() # 训练神经网络模型 history = model.fit(train_X, train_Y, epochs=100, batch_size=32, verbose=0) train_predict = model.predict(train_X) test_predict = model.predict(test_X) # 输出模型拟合度 print('Train R2 score:', r2_score(train_Y, train_predict)) print('Test R2 score:', r2_score(test_Y, test_predict)) # 输出 MAE、MSE 以及相对误差平均百分比 print('MAE:', mean_absolute_error(test_Y, test_predict)) print('MSE:', mean_squared_error(test_Y, test_predict)) print('Relative error:', np.mean(np.abs(test_predict - test_Y) / test_Y) * 100, '%') # 绘制 R2 图 plt.scatter(train_Y, train_predict, label='Train') plt.scatter(test_Y, test_predict, label='Test') plt.plot([min(train_Y + test_Y), max(train_Y + test_Y)], [min(train_Y + test_Y), max(train_Y + test_Y)], 'k--') plt.xlabel('True values') plt.ylabel('Predicted values') plt.title('R2: Train=%.3f, Test=%.3f' % (r2_score(train_Y, train_predict), r2_score(test_Y, test_predict))) plt.legend() plt.show() # 绘制各输入输出的拟合折线图 for i in range(train_X.shape[1]): plt.figure(figsize=(8, 6)) plt.scatter(train_X[:, i], train_Y, label='Train') plt.scatter(test_X[:, i], test_Y, label='Test') plt.plot(sorted(train_X[:, i]), model.predict(np.sort(train_X[:, i].reshape(-1, 1))), 'r--', label='Fitting curve') plt.xlabel('Input ' + str(i + 1)) plt.ylabel('Output') plt.title('Fitting curve of Input ' + str(i + 1) + ': R2=%.3f' % r2_score(test_Y, test_predict)) plt.legend() plt.show() ``` 至此,我们完成了使用 Python 和 Keras 模块创建一个使用归一化、Xavier 初始化、正则化方法和 MSGD 的 BP 网络的任务,并实现了在训练后,将同样 8 个输入 1 个输出的测试集进行预测得出预测输出值。同时,我们还实现了绘制 R2 图来说明模型的拟合度,并输出 MAE、MSE、预测值和真实值之间的相对误差平均百分比,绘制各输入输出的拟合折线图,且 R2 图和折线图中使用的数据均为未变换数据。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

轨迹的路口

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值