统计学
文章平均质量分 87
allein_STR
希望在这个平台充实自己,记录自己成长的一点一滴。
展开
-
常用的八大概率分布及其实现
A 为观察值,E为理论值,k为观察值的个数,最后一个式子实际上就是具体计算的方法了 n 为总的频数,p为理论频率,那么n*p自然就是理论频数(理论值)n 是称为“自由度”的参数,有时可以看到它被称为“d.o.f.” 对于较高的 n 值,t 分布更接近正态分布。t 分布是在样本量较小且总体标准差未知的情况下估计正态分布总体的均值时出现的连续概率分布族的任何成员。要注意的是,在正态分布中,均值、众数和中位数都是相等的。卡方检验的基本公式,也就是χ2的计算公式,即观察值和理论值之间的偏差。P = 二项分布概率。原创 2023-03-14 09:54:50 · 452 阅读 · 0 评论 -
常用统计检验Python代码!
常用统计检验Python代码!转载 2023-02-14 09:02:03 · 1149 阅读 · 2 评论 -
【一文讲通】如何检测数据满足同分布
1 统计指标的方法1.1群体稳定性指标(Population Stability Index,PSI)群体稳定性指标(Population Stability Index,PSI), 衡量未来的样本(如测试集)及训练样本评分的分布比例是否保持一致,以评估数据/模型的稳定性(按照经验值,PSI原创 2023-01-07 16:57:45 · 711 阅读 · 0 评论 -
【可视化】无法理解PCA,条件概率,最小二乘回归?可视化帮你!
在下面的示例中,原始数据以3D的形式绘制,但可以通过不同的视角,将其投射到2D空间。下面,OLS是在幕后进行的,以产生回归方程。这是一个很好的迹象,我们所看到的结构反映了现实世界地理的一个重要事实北爱尔兰是四个国家中唯一一个不在大不列颠岛上的。例如,假设我们一开始就知道 "样本人口 "中一群人的身高和手掌大小,并且我们想找出一种方法,从身高预测不在样本中的人的手掌大小。下面,误差的平方表示为正方形,你的工作是选择betas(回归线的斜率和截距),使所有正方形的总面积(误差的平方之和)尽可能的小。原创 2023-01-05 21:11:43 · 304 阅读 · 2 评论 -
关于你不知道的特征归一化/标准化
1. Feature scaling 的必要性 特征间的单位(尺度)可能不同,比如身高和体重,比如摄氏度和华氏度,比如房屋面积和房间数,一个特征的变化范围可能是[1000, 10000],另一个特征的变化范围可能是[−0.1,0.2],在进行距离有关的计算时,单位的不同会导致计算结果的不同,尺度大的特征会起决定性作用,而尺度小的特征其作用可能会被忽略,为了消除特征间单位和尺度差异的影响,以对每维特征同等看待,需要对特征进行归一化。 原始特征下,因尺度差异,其损失函数的等高线图可能是椭圆形,梯原创 2022-04-03 14:56:13 · 201 阅读 · 0 评论 -
决定系数R2真的可靠吗?
目录1. R22. 是否可以通过比较R方大小,来证明“加入某个变量有利于提高模型的拟合程度”?3. 调整后的R24. R方不能支持模型的哪些假设?5. R2和调整后的R2调用方法1. R21) 含义:反应回归模型拟合数据的优良程度2)分析实际信息:点的实际值 减去 均值 认为是 这个点的实际信息(蓝色条),可以拆分成下面两部分 误差信息:实际值减线上的点的值,这是未拟合出来的信息(黄色条) 拟合出的信息:拟合出来的线上的点 减 均值 (红色条)对于一个模型来原创 2021-11-23 13:54:00 · 3095 阅读 · 0 评论 -
统计学相关问答
1、为什么要对相关系数进行显著性检验?1)实际上完全没有关系的变量,在利用样本数据进行计算时也可能得到一个较大的相关系数值(尤其是时间序列数值)2)当样本数较少,相关系数就很大。当样本量从100减少到40后,相关系数大概率会上升,但上升到多少,这个就不能保证了;取决于你的剔除数据原则,还有这组数据真的可能不存在相关性;改变两列数据的顺序,不会对相关系数,和散点图(拟合的函数曲线)造成影响;对两列数据进行归一化处理,标准化处理,不会影响相关系数;我们计算的相关系数是线性相关系数,只能反映两者是转载 2021-11-21 13:24:49 · 886 阅读 · 0 评论 -
统计学十问答
目录1、问:自由度是什么?怎样确定?2、问:正态分布检验中自由度问题3、问:t检验4、问:统计学意义(P值)5、问:如何判定结果具有真实的显著性6、问:所有的检验统计都是正态分布的吗?7、问:假设检验的内涵及步骤8、问:卡方检验的结果,值是越大越好,还是越小越好?9、问:在比较两组数据的率是否相同时,二项分布和卡方检验有什么不同?10、问:如何比较两组数据之间的差异性1、问:自由度是什么?怎样确定?答:(定义)构成样本统计量的独立的样本观测值的数目或自.转载 2021-11-20 22:35:35 · 872 阅读 · 0 评论