统计
文章平均质量分 80
S_o_l_o_n
logic
展开
-
贝叶斯统计
频率学派经典估计和贝叶斯估计经典的频率学派的参数估计方法有矩估计和最大似然估计,假设样本是在一个客观固定的参数所确定的概率模型下生成的,这个前提下,直接先假设一个未知参数,然后根据某些原则(矩相等或者最大似然原则)求出未知参数值。由于频率学派认为参数是固定的未知常数,因此,对参数不会存在概率类似的阐述。例如,对于未知参数估计的在一定置信水平alpha下的置信区间,频率学派的正确解释是:如果进行n次试验,那么会有alpha*n次,真实的参数会落在这个置信区间中,而对于一次采样试验来说,参数是否落在这个区间原创 2023-01-27 21:40:24 · 855 阅读 · 0 评论 -
What is P value and Significance Level?
在统计学的假设检验中,有一个概念叫做P值,一般通过P值跟提前定好的显著性水平进行对比,来判断是否应该拒绝原假设。如果P值比显著性水平更低,则拒绝原假设,反之,没有充分的证据拒绝原假设。在学统计的人眼中,这是很自然的,以至于不需要去进一步想一些细节,比如,P值到底是什么?如何去准确的理解?P值的定义是,在原假设的基础上,统计量X的值,理论上至少跟已观察统计量一样极端的概率。更具体地,假设是右侧检验,P值就等于。其中X表示某个统计量,我们可以在原假设为真的基础上求出X的分布,...原创 2022-03-06 22:27:33 · 1408 阅读 · 0 评论 -
主成分分析(PCA)的一种理解和推导
主成分分析的语境一般如下:假设需要预测的变量y由k个因素所制约,但是k比较大,使得数据维度较高,为了降低维度,简化计算以及缓解shu原创 2021-06-20 23:01:56 · 720 阅读 · 2 评论 -
R squared的几何解释以及和相关系数的关系
如图。对于X,Y,利用多维空间将随机变量向量化,直线l表示各个坐标相等的点集,h是Y到X和l组成的超平面的垂点,Ph和超平面正交。这里X表示自变量,Y为应变量,l自然就表示截距。左边两图分别表示有无截距地现行回归结果示意图,最右边是无回归下的示意图。...原创 2020-12-16 20:11:59 · 1709 阅读 · 0 评论