1、背景
2、相关工作
2.1 相关性分析
皮尔逊系数:衡量线性相关性
t检验:小样本的统计分析方法,通过比较不同数据的均值,研究两组数据是否存在差异
https://www.matongxue.com/madocs/580/
https://zhuanlan.zhihu.com/p/124072225
方差分析:判断多组间之间的差距性
https://www.zhihu.com/question/61319844
相关分析之相关系数:度量两个变量之间线性相关的方向和强度的测度
https://blog.csdn.net/longxibendi/article/details/82558801
Shapiro-Wilk (SW) 检验:判断样本是否符合正态分布
https://blog.csdn.net/zzminer/article/details/8858469
z检验:比较两个样本的均值是否有显著性的差异
https://zhuanlan.zhihu.com/p/49468324
https://blog.csdn.net/guomutian911/article/details/81604545
2.2 回归分析
线性回归、岭回归:对连续型的数据做出预测
https://blog.csdn.net/wmymo/article/details/79505445
Gini基尼系数:衡量收入是否平衡、分类是否易分(基尼杂质越高就代表越容易分类错误,也就越不好)
https://www.jianshu.com/p/95a4f076513c