Python统计学12——加权最小二乘

加权最小二乘 的思想是在最小二乘上进行了改进。从损失函数角度来看,就是在每个样本的误差平方和求和之前,给每个误差平方赋予了一个权重,这个权重有很多种取法。可以把那残差平方的倒数作为权重。这样就可以让误差大的样本对于损失函数的影响较小,不受极端值的影响,拟合效果可以更好。

本次使用人工数据集,仿真实验。人工生成的数据集的好处就是可以自己给数据加你想要的扰动项,可以加上异方差。然后回归系数的真实值你是知道的,所以就很方便验证模型的拟合能力。


导入包

import numpy as np
import matplotlib.pyplot as plt
import statsmodels.api as sm
from scipy import stats
from statsmodels.iolib.table import SimpleTable, default_txt_fmt

np.random.seed(1024)

 

生成人工数据 

生成X

nsample = 100
x = np.linspace(1, 100, nsample)
#X = np.column_stack((x, (x - 5) ** 2))      #抛物线数据
X = sm.add_constant(X)                       #添加常数列
X[:5]

 生成y

beta = [5.0, 0.5, ]#-0.01]
y_true = np.dot(X, beta)
y_true

 可以看到y是为y=5+0.5x,这是实际的方程。

添加扰动项

#添加残差
sig = 0.75
w = np.linspace(1, 10, nsample)
e = np.random.normal(size=nsample)
e=sig * w * e
y = y_true + e
X = X[:, [0, 1]]

W为扰动项的大小程度 ,我们让它线性增大,即x越大,残差的波动也越大。

画图查看

plt.figure(figsize=(6,4))
plt.scatter(x,y)

 可以看到X增大,Y的波动明显增大,数据存在异方差。


最小二乘

res_ols = sm.OLS(y, X).fit()
print(res_ols.summary())

 可以看到拟合优度为88.8%。


加权最小二乘

将最小二乘的残差取出来,绝对值后,再倒数后最为wls的权重。

mod_wls = sm.WLS(y, X, weights=1.0 / abs(res_ols.resid))
res_wls = mod_wls.fit()
print(res_wls.summary())

 

可以看到拟合优度变为了99% 

回归系数对比

print(res_ols.params)
print(res_wls.params)

 

 稍微比ols更加接近真实参数的值。

 画图对比

y_hat=res_wls.params[0]+res_wls.params[1]*x
y_hat_ols=res_ols.params[0]+res_ols.params[1]*x
plt.figure(figsize=(6,4))
plt.scatter(x,y)
plt.plot(x,y_hat,label='wls')
plt.plot(x,y_hat_ols,label='ols')
plt.legend()

​​​​​​​

两条线有点重合.....在该数据集上可能效果不是很明显 

  • 2
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Java定时器(timer)是一种能够在特定时间间隔或者特定时间点执行某些任务的工具。它可以帮助我们实现很多有用的定时任务,如定时备份数据、定时发送邮件、定时清理缓存等等。 Java中的定时器主要有两种实现方式:一种是使用Timer类,另一种是使用ScheduledExecutorService接口。在本文中,我们主要介绍使用Timer类的实现方式。 使用Timer类创建定时器的步骤如下: 1. 创建一个Timer对象 ```java Timer timer = new Timer(); ``` 2. 创建一个TimerTask对象,用于执行定时任务 ```java TimerTask task = new TimerTask() { @Override public void run() { // 定时任务的具体实现 } }; ``` 3. 调用Timer对象的schedule()方法,设置定时任务的执行时间和执行频率 ```java timer.schedule(task, delay, period); ``` 其中,delay表示任务的延迟时间,单位为毫秒;period表示任务的执行周期,单位也为毫秒。如果period为0,则表示只执行一次任务。 完整的示例代码如下: ```java import java.util.Timer; import java.util.TimerTask; public class MyTimerTask extends TimerTask { @Override public void run() { System.out.println("定时任务执行了"); } public static void main(String[] args) { Timer timer = new Timer(); MyTimerTask task = new MyTimerTask(); timer.schedule(task, 1000, 2000); } } ``` 在上面的示例代码中,我们创建了一个MyTimerTask类,继承了TimerTask类,并实现了run()方法。在main()方法中,我们创建了一个Timer对象和一个MyTimerTask对象,并调用了schedule()方法,设置了任务的延迟时间为1000毫秒,执行周期为2000毫秒。当程序执行到schedule()方法时,定时器会在1000毫秒后开始执行定时任务,并且每隔2000毫秒执行一次。 需要注意的是,当定时任务执行时间超过执行周期时,定时器会等待当前任务执行完毕后立即执行下一次任务,而不是等待执行周期结束再执行。如果我们想要避免这种情况,可以考虑使用ScheduledExecutorService接口来实现定时任务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

阡之尘埃

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值