线性回归算法梳理 task2

1.生成数据
x = np.array([0,1,2,3,4,5,6,7,8,9,10])
y = np.array([12,14,18,19,21,23,24,26,27,29,31])#显示数据

plt.scatter(x,y)
plt.show()

在这里插入图片描述

2.算术法求解
#对数据集进行3:7的拆分
x_train = x[:7].reshape(-1,1)
x_test = x[7:].reshape(-1,1)
y_train = y[:7]
y_test = y[7:]

然后利用公式对系数和截距进行计算
b 1 = ∑ i = 1 n ( x ( i ) − x ‾ ) ( y ( i ) − y ‾ ) ∑ i = 1 n ( x ( i ) − x ‾ ) 2 b1 = \frac{\sum_{i=1}^{n}(x^{(i)}-\overline{x})(y^{(i)}-\overline{y})}{\sum_{i=1}^{n}(x^{(i)}-\overline{x})^2} b1=i=1n(x(i)x)2i=1n(x(i)x)(y(i)y)
b 0 = y ‾ − b 1 ∗ x ‾ b0 = \overline{y}-b1 *\overline{x} b0=yb1x

num = 0
d = 0
n = len(x_train)
for i in range(0,len(x_train)):
    num += (x_train[i]-np.mean(x_train))*(y_train[i]-np.mean(y_train)) #分子
    d += (x_train[i]-np.mean(x_train))**2 #分母
b1 = 1.0*num / float(d)
b0 = np.mean(y_train) - b1*np.mean(x_train)

得到b0,b1的结果分别为

(array([2.03571429]), array([12.60714286]))

将直线绘制出来

x_ = np.linspace(0,10,100)
y_ = b1*x_ + b0
plt.scatter(x,y)
plt.plot(x_,y_,c='r')
plt.show()

在这里插入图片描述

3.向量法求解
regression = linear_model.LinearRegression()#创建回归模型
regression.fit(x_train,y_train)
b0,b1 = regression.intercept_,regression.coef_

得到b1,b0的值分别为

(12.60714285714286, array([2.03571429]))

再将直线绘制出来
在这里插入图片描述

4.算术法向量法的性能比较

通过计算两者的SSE进行比较

SSE = 0
pre = b0 + b1*x_test
for i in range(0,4):
    SSE += (y_test[i]-pre[i])**2
print(SSE)

得到两者的SSE都大约为

[11.89540816]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值