xmu_glm
上进的菜鸟
这个作者很懒,什么都没留下…
展开
-
python离散因变量模型
Binary Probit模型连接函数为正态from statsmodels.formula.api import glmformula='Attention~CSI+Company+Loyalty'product_m=glm(formula,data=product,family=sm.families.Binomial(sm.families.links.probit)).fit...原创 2019-11-26 14:06:56 · 1385 阅读 · 0 评论 -
python回归分析
目录含定性变量的线性回归非线性回归含定性变量的线性回归# 1.treatment包实现dummyfrom patsy.contrasts import Treatmentcontrast = Treatment(reference=3).code_without_intercept([1,2,3])#分类变量有三个属性分别可以用1,2,3表示,参考属性设置为3(表现...原创 2019-11-26 13:39:26 · 1674 阅读 · 0 评论 -
python相关分析和关联分析
相关分析函数关系:相关关系:影响不存在方向性,比如身高越高体重越重,但不能说身高增加1cm体重增加2kg相关分析不具有传递性,A和C相关,B和C相关,A和B不一定相关相关系数的显著性检验#1.两两相关性[有相关系数有p值]correlation=[]for I in car_corr[['weight','circle','horsepower']].columns: ...原创 2019-11-25 20:00:35 · 3139 阅读 · 0 评论 -
python非参数检验
目录单样本非参数检验中位数(均值)检验【wilcoxon符号值秩检验】分布的检验游程检验两样本的非参数检验独立样本中位数(均值)检验【Mann-Whitney-Wilcoxon检验or Wilcoxon秩和检验】独立样本的分布检验配对样本中位数的检验两样本游程检验多个样本的非参数检验多个样本的分布检验独立样本位置的检验在总体分布未知或与总体...原创 2019-11-25 15:42:01 · 5275 阅读 · 2 评论 -
python方差分析
目录一元方差分析一元单因素方差分析一元多因素方差分析协方差分析一元方差分析一元单因素方差分析场景:5种不同像素的数码相机(单因素)对销量(研究的因变量)是否有显著差异G = dc_sales['pixel'].unique()args = []for I in list(G): args.append(dc_sales[dc_sal...原创 2019-11-22 10:18:40 · 3747 阅读 · 0 评论 -
python假设检验
单样本均值Z检验适合条件:1.总体方差已知,小样本/大样本;2.总体方差未知,大样本(n>=30)# ho:u<=4,所以value=4,alternative[备择假设]='lager'sm.stats.DescrStatsW(moisture['moisture']).ztest_mean(value=4,alternative='lager')单样本均值t检验...原创 2019-11-21 17:54:02 · 1513 阅读 · 0 评论 -
python数据描述
目录集中趋势均值(加权截尾去尾几何调和)中位数分位数众数极差四分位差方差和标准差协方差变异系数(标准差系数、离散系数)分布形状偏度(数据分布对称性的测度)峰度(数据分布曲线顶端陡峭或扁平程度的指标)数据透视表集中趋势均值(加权截尾去尾几何调和)np.mean(jd_stock['opening_price'])# 加权算术平...原创 2019-11-21 16:06:40 · 2926 阅读 · 0 评论 -
sofa错题集锦2
转载 2019-05-19 10:19:43 · 298 阅读 · 0 评论 -
PCA与FA
主成分分析和因子分析的关系是包含与扩展。当因子分析提取公因子的方法是主成分(矩阵线性组合)时,因子分析结论的前半部分内容就是主成分分析的内容,而因子旋转是因子分析的专属(扩展),主成分分析是因子分析(提取公因子方法为主成分)的中间步骤。这就是为什么很多软件没有专门为主成分分析独立设计模块的原因。从应用范围和功能上讲,因子分析法完全能够替代主成分分析,并且解决了主成分分析不利于含义解释的问题...原创 2019-08-02 15:54:58 · 580 阅读 · 0 评论 -
ks-test
Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法。其原假设H0:两个数据分布一致或者数据符合理论分布。D=max| f(x)- g(x)|,当实际观测值D>D(n,α)则拒绝H0,否则则接受H0假设。KS检验与t-检验之类的其他方法不同是KS检验不需要知道数据的分布情况,可以算是一种非参数检验方法。当然这样方便的代价就是当检验的数...转载 2019-07-31 10:29:17 · 4337 阅读 · 0 评论 -
双因素方差分析
统计学简介之十七——双因素方差分析一、双因素方差分析定义二、分析过程2.1 数据结构2.2 分析步骤转载 2019-08-12 14:28:53 · 18374 阅读 · 2 评论 -
sofa统计题错误集锦
这一题呢,要注意原创 2019-05-06 20:37:05 · 165 阅读 · 0 评论 -
理解协方差和相关系数
https://www.zhihu.com/question/20852004http://blog.codinglabs.org/articles/pca-tutorial.html转载 2018-10-02 21:26:19 · 165 阅读 · 0 评论 -
残差图+两变量+ECDF
正态QQ图的原理QQ图通过把测试样本数据的分位数与已知分布相比较,从而来检验数据的分布情况QQ图是一种散点图,对应于正态分布的QQ图,就是由标准正态分布的分位数为横坐标,样本值为纵坐标的散点图。要利用QQ图鉴别样本数据是否近似于正态分布,只需看QQ图上的点是否近似地在一条直线附近,图形是直线说明是正态分布,而且该直线的斜率为标准差,截距为均值,用QQ图还可获得样本偏度和峰度的粗...原创 2018-10-09 21:50:39 · 3700 阅读 · 0 评论 -
Multivarite Test
原创 2018-10-30 20:31:47 · 142 阅读 · 0 评论 -
多重共线性+变量选择(钟老师)
原创 2018-12-12 21:45:46 · 1464 阅读 · 2 评论 -
惩罚总结(马老师)
原创 2018-12-12 21:48:22 · 267 阅读 · 0 评论 -
Screening
原创 2018-12-12 21:49:45 · 742 阅读 · 0 评论 -
层次性惩罚(马老师)
原创 2018-12-12 21:51:20 · 323 阅读 · 0 评论 -
整合分析(不同的数据源,同一个问题)
原创 2018-12-12 21:52:57 · 2189 阅读 · 0 评论 -
python--统计
1.15个统计检验的cheatsheethttps://machinelearningmastery.com/statistical-hypothesis-tests-in-python-cheat-sheet/转载 2019-01-02 19:27:53 · 174 阅读 · 0 评论 -
泊松分布
通俗理解泊松分布:https://blog.csdn.net/ccnt_2012/article/details/81114920如果某事件以固定强度λ,随机且独立地出现,该事件在单位时间内出现的次数(个数)可以看成是服从泊松分布举个例子吧:假如我平均每天去超市三次,那我明天会去超市几次?注意,平均每天去超市三次,并不代表每天一定去超市三次。这里的平均每天去超市三次就是指固定...转载 2019-04-05 15:54:49 · 5049 阅读 · 0 评论 -
马氏距离详解
https://www.ph0en1x.space/2018/04/18/Mahalanobis/https://blog.csdn.net/panglinzhuo/article/details/77801869转载 2019-04-07 09:11:57 · 1200 阅读 · 0 评论 -
泊松分布-指数分布-伽马分布
from:国防科技技术大学理学院 概率论与数理统计转载 2019-04-10 09:47:46 · 5147 阅读 · 0 评论 -
因子分析
原创 2019-04-17 09:05:00 · 199 阅读 · 0 评论 -
理解特征向量/特征空间和样本空间
原创 2018-10-09 21:49:21 · 9849 阅读 · 0 评论