对于一般数据集,我们往往可以从最简单的模型入手进行尝试,假如简单的模型得出的结果与实际不符那么再更改模型,增加模型中的参数或者调整幂次等方式。
接下来从最简单的线性模型入手,介绍如何用python进行实现。
操作步骤:
(1)首先我们要进行数据集的读入,这里一般数据集都是以csv格式保存,我们可以通过pandas进行读入,并将特征值和目标值分开存储。
(2)定义前馈函数,也就是用来计算预测值
(3)定义损失函数,将预测值和真实值进行相应的计算
(4)对于权重w循环取值,然后将之前存入的特征值和标签取出进行计算,并求出每个权重w对应的均方误差。
(5)可视化展示对应的过程,并找到使得Loss最低的权重。
代码实现:
# -*- coding: utf-8 -*-
# @Time : 2022/1/21 12:00
# @Author : CH339
# @FileName: Test1_21.py
# @Software: PyCharm
# @Blog :https://blog.csdn.net/weixin_56068397/article/
"""
机器学习——手动实现线性模型
"""
import numpy as np
import matplotlib.pyplot as plt
# 准备数据集
x_data = [1.0,2.0,3.0]
y_data = [2.0,4.0,6.0]
# 定义模型
def forward(x,w):
# 这里使用线性模型y=ax
return x*w
# 定义损失函数
def loss(x,y,w):
# 计算预测值
y_predict = forward(x,w)
return (y_predict-y)*(y_predict-y)
# 定义列表用来存储权重和loss
w_list = []
mse_list = []
for w in np.arange(0.0,4.1,0.1):
mse_sum = 0
print('w=',w)
for x_val,y_val in zip(x_data,y_data):
# 预测值
y_pre = forward(x_val,w)
# 损失
los = loss(x_val,y_val,w)
mse_sum += los
print(x_val,y_val,y_pre,los)
# 对于每一个权重计算均方误差
mse = mse_sum / len(x_data)
# 将权重和均方误差追加到列表当中
w_list.append(w)
mse_list.append(mse)
print('MSE=',mse)
# 绘制loss图以便于找出w
plt.plot(w_list,mse_list)
plt.xlabel("w")
plt.ylabel("Loss")
plt.show()
可视化展示:
部分权重及MSE展示:
从图中我们可知当w取值为2时,使得Loss最低。
ps:
在一般情况下,我们不采用将权重w作为横坐标,常用迭代轮次Epoch作为横坐标。