一篇科学的排队指南(简单线性回归和时间序列模型的应用)

大家日常生活中有时会需要抽签上场演讲、答辩、汇报或者即兴表演,如果是自娱自乐那还好,万一是诸如毕业论文答辩这样的重要场合,各种抽签玄学必然会广为流传。
想必大家都听过类似的说法:
“排名靠前才有优势,讲的内容不容易重复,评委们都会认真听,得分能高一些,排在后面评委都困了不会给高分的。”
“你可别乱说,苏格拉底最大的麦穗故事没听过吗,评委都喜欢把高分留在最后面。”
“哎呀你们都是扯淡,答辩都是多人评分,还去掉最高分和最低分,没有你们说的那么玄乎,前后都差不太多好吗。”
那么这些说法到底是不是真的有意义呢?今天我们用一次竞赛实际数据做一次小小的实验。

数据来源:某头部金融机构内部比赛评分。
数据说明:五个一组,即每评定五位选手之后评委休息讨论。

参考文献:

https://blog.csdn.net/yangwohenmai1/article/details/85071683

首先我们来看一下基本的数据情况:

sz=data['总分']
swz=data['未平滑总分']
plt.plot(sz)
plt.plot(swz, color="red")
plt.show()
print("variance:%f" % np.var(sz))
print("variance:%f" % np.var(swz))

虽然这个图(蓝色:去除最高分最低分之后选手平均分。红色:原始平均分)感觉不是特别明显,但是从方差来看,去除最高最低分之后数据波动性的确是下降了(11.771769→10.849152),那么这个对排序是否有影响呢?
在这里插入图片描述再仔细观察一下,似乎先上场(1-10)号选手的得分波动率比后上场的选手波动率更大呢,而且这个一上一下的得分模式是什么意思,难不成存在均值回归(mean-reversion)特性吗?等一下,貌似有点跑题,本次小实验我们明明是想研究一下排序到底对选手得分有无实质性影响,好吧,那我们继续。
首先假设忽略异方差带来的影响,“强行”做线性回归,看看是什么样子呢?

timemodel = linear_model.LinearRegression()
timemodel.fit(timex,<
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
线性回归是一种常见的预测时间序列的型,它基于线性关系建立了自变量与因变量之间的线性方程。在时间序列预测中,可以使用以下线性回归的变体模型: 1. 简单线性回归:使用单个自变量与因变量之间的线性关系进行建模,适用于只有一个预测因素的简单情况。 2. 多元线性回归:基于多个自变量与因变量之间的线性关系进行建模,可以考虑多个预测因素对时间序列的影响。 3. 多项式回归:在线性回归的基础上,引入多项式特征,将自变量的高阶项添加到模型中,以捕捉非线性关系。 4. 岭回归:通过引入L2正则化项,可以处理特征之间的共线性问题,并提高模型的泛化能力。 5. Lasso回归:通过引入L1正则化项,可以进行特征选择,将不重要的特征的系数缩小为零。 6. Elastic Net回归:结合了岭回归和Lasso回归的优点,既能处理共线性问题,又能进行特征选择。 7. 广义线性模型(Generalized Linear Model,GLM):在线性回归的基础上,可以通过引入非线性的链接函数和指数族分布,适应不同类型的因变量。 这些线性回归的变体模型时间序列预测中可以根据具体问题的需求进行选择和应用。需要注意的是,线性回归模型假设自变量与因变量之间存在线性关系,对于非线性的数据关系可能表现较差。在实际应用中,可能需要尝试多个模型并进行比较,以找到最佳的预测效果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值