统计学习
文章平均质量分 76
统计学习
一碗姜汤
科学的世界谈不上真正的理解,你只是去习惯它。
展开
-
面板数据门槛归回分析,xthreg的安装,xthreg2安装包
我用的是Stata17,数据是不平衡的面板数据,需要用到xthreg2,虽然我找到了xthreg2.ado,但是还需要安装xthreg,因为运行xthreg2需要xthreg包顺带安装的lxthreg.mlib文件。但是!我后来发现还是不行,最后是去买了一个真正能用到xthreg2的lxthreg.mlib文件,才可以运行。原创 2024-04-22 09:37:20 · 815 阅读 · 0 评论 -
【随机过程01】高斯过程
处理非线性问题,我们一共有三招:1.积分(一般不要用)2.Price定理(一般情况下很好用)3.特征函数(指数函数的情况下特别好用)三角函数和指数函数是一个意思。我们中学给大家打下的烙印不太对,把这两者生生地割裂开,这是因为我们没有强调复平面的核心作用,所以应当先教复数,建立起平面、矢量的概念,把二维平面的矢量与复数能够建立起联系,随后诸如什么三角变换,旋转,平移等等一系列问题都迎刃而解了,你想想旋转不就是乘上一个复因子嘛,到线性代数就是乘上一个矩阵了,事实上,矩阵C−SSC∼Cj。原创 2024-04-21 11:40:19 · 868 阅读 · 0 评论 -
粒子滤波(序贯蒙特卡洛)及其python实现
参考视频:现代数字信号处理II_张颢 授课教师:张颢 2020-2021学年(春)第二学期(第20集)一、原理讲解序贯的蒙特卡罗,这是一个什么问题呢?现在我们考虑这样的模型:这是一种所谓叫做状态空间模型也有人管这个东西叫隐马尔可夫模型,说的是一个意思。就是现在,我们有一条马尔可夫链,然后这里头的每一个状态都有一系列的取值。每一个状态针对的是某一时刻的情况,所以说它是带有时间信息的,同时我们也称之为叫做序贯的。那么这个马尔可夫链有什么特点呢?就是它的这个所谓叫做状态呀,是直接观测不到的。你能够拿原创 2024-04-21 10:49:15 · 936 阅读 · 0 评论 -
压缩感知——稀疏恢复
一般来说,相似题材的书籍会有相似的读者,若能将书籍按题材归类,则题材总数必然远远小于书籍总数,因此从题材的角度来看,表中反应出的信号应该是稀疏的。事实上,在很多应用中均可获得具有稀疏性的 s,例如图像或声音的数字信号通常在时域上不具有稀疏性,但通过傅里叶变换、余弦变换、小波变换等处理后却会转化为频域上的稀疏信号。压缩感知的优点是可以显著减少采集数据的数量,从而减少存储和传输的开销,特别适用于数据采集成本高、数据存储和传输能力受限的场景,如遥感成像、医学成像(MRI)等领域。其中,X 表示需恢复的稀疏信号;原创 2024-03-23 17:45:56 · 706 阅读 · 0 评论 -
kalman滤波python实现——基于维纳退化模型
为diffusion coef ,为drift coef,原创 2024-03-14 19:52:51 · 396 阅读 · 0 评论 -
【pymc】Modeling Heteroscedasticity with BART
具体来说,BART 对回归树的组合使用了贝叶斯模型平均(Bayesian Model Averaging)的思想,即考虑多个回归树的预测结果,并对其进行加权平均,以减少过拟合和提高模型的泛化能力。:BART 使用回归树来建模数据,每个回归树表示为一系列决策规则(即节点),这些规则将输入空间划分为不同的区域,并为每个区域分配一个常数值作为预测输出。- 然后,BART 将多棵树的预测结果进行组合,通过对树的预测值进行加权平均来获得最终的模型预测结果。在这个过程中,每棵树的权重由其在后验分布中的概率来确定。原创 2024-02-26 23:43:14 · 405 阅读 · 0 评论 -
基于货币供应量(M2)同比增长率序列的时间序列建模案例
通过看时序图可以发现,轨迹不符合趋势平稳或趋势非平稳序列的典型特征,因此无需在单位根检验模型中包含时间趋势项,可以从只包含截距项的模型入手,进行。该估计结果表明:估计系数具有显著性,并且满足GARCH模型关于参数非负和参数有界的限定条件。DF统计量为-2.8331,小于10%临界值-2.57,因此拒绝序列存在单位根的原假设。判断序列的平稳性,采用只包含截距项的模型来对M2同比增长序列进行ADF检验。拒绝模型的残差序列不存在异方差性的原假设。信息判断准则,来确定模型的恰当的滞后期。原创 2023-02-13 21:59:01 · 518 阅读 · 0 评论 -
详解布朗运动(Brown Motion)
第四点在给定样本w时,B(w,t)是关于t的连续函数。独立增量+增量服从高斯分布一定能够得出高斯过程,证明过程很如下:高斯过程是用多维高斯来定义的:等式左边各个分量都是独立高斯,合起来也就是联合高斯高斯经过线性变换(同时左乘右边第一个可逆矩阵的逆)还是高斯。第三条相关函数取t,s的最小值,说明它已经是正交增量了。而高斯过程保证了正交即为独立。两个随机变量正交,当然他们不一定独立,但是如果两个随机变量正交且都服从高斯分布,它们之间就独立了。原创 2023-12-31 18:39:00 · 1075 阅读 · 0 评论 -
详解卡尔曼滤波(Kalman Filter)
黑盒(Black Box)思想最早由维纳(Wiener)在1939年提出,即假定我们对从数据到估计中间的映射过程一无所知,仅仅用线性估计(我们知道在高斯背景下,线性估计能达到克拉美劳下界,是最优估计)来掩盖我们的无知。但是,到了二十年以后的1960年卡尔曼的年代,我们对于红框内的事(prior knowledge),很有可能是知道的,并且知道得很详细,很清楚。再这样的情况下,我们还不能有效地利用这一部分先验知识来帮助我们把估计做的更好就没有任何道理了。卡尔曼就是从红框入手,将这部分先验信息表达出来。至于怎么原创 2023-12-30 20:50:52 · 1964 阅读 · 0 评论 -
EM算法公式详细推导
即EM算法是通过不断求解下界的极大化逼近求解对数似然函数极大化的算法。我们虽然无法一次性做到极大化,但是EM算法提出,我们可以用。我们面对一个含有隐变量的概率模型,目标是极大化。由高斯混合模型生成。我们用EM算法估计参数。EM算法的优点是简单性和普适性。只需在迭代过程中保证新的估计值。达到最大,计算过程中可以省去对。则EM算法的一次迭代,即极大化。迭代的方式来近似逼近极大化。有尽可能大的增长,选择。原创 2024-01-03 23:22:59 · 629 阅读 · 0 评论 -
如何用自助法或刀切法来估计偏差、方差?
自助法和刀切法(也叫水手刀法)为计算标准误差和置信区间的非参数方法。刀切法耗费较少计算机资源,但自助法有某些统计优势。由Quenouille(1949)提出的刀切法是用来对估计的偏差和方差进行近似的一个简单方法。符号说明:定义:解释:在关于的适当条件下(例如为样本均值的一个光滑函数),能够显示,为的相合估计。自助法(bootstrap)是估计一个统计量的方差和分布的个方法。还能利用自助法来构造置信区间。原创 2024-01-05 11:15:06 · 501 阅读 · 0 评论 -
最大后验概率法
如果后验分布的模可以以封闭的数学形式给出(比如使用共轭先验时),则可以用分析方法得到MAP估计。如果不能得到封闭形式,或者太复杂,则可用共轭梯度法或牛顿法等数值优化法,这通常需要采用两阶导数。如果不用导数,可使用改进的EM算法,也可以使用模拟退火的蒙特卡洛方法。方法密切相关,但采用了一个包含先验分布的增强优化目标。因此,MAP估计可以看作ML估计的正则化方法。是对后验分布的模的估计。MAP可根据经验数据获得未观测量的点估计。显然,如果先验分布是个常数,原创 2023-12-29 17:14:32 · 397 阅读 · 0 评论 -
贝叶斯推断:细谈贝叶斯变分和贝叶斯网络
统计推断这件事大家并不陌生,如果有一些采样数据,我们就可以去建立模型,建立模型之后,我们通过对这个模型的分析会得到一些结论,不管我们得到的结论是什么样的结论,我们都可以称之为是某种推断。对于数据和未知参数会建立起关于数据的模型,模型当中会有我们的参数,如果我们把参数看成是确定的未知量。我们就可以用频率学派的观点来进行推断了。此时数据是随机量,参数是确定量,我们用数据来估计参数,也就是构成所谓的,然后用这个统计去对参数进行。我们还会有各种各样的关于这个估计好坏的说法,也就是有各种各样的。原创 2024-01-02 22:38:04 · 2106 阅读 · 0 评论 -
变分贝叶斯近似
Wang and Titterington (2004) 证明,在足够多的观测结果下,这种近似分布家族将正确地描述后验均值,而这对基于抽样的推断方法一般是不成立的。对于完全贝叶斯推断,变分近似通常比MCMC快得多,在某些情况下,它有助于估计其他方法无法估计的模型。这种被低估的可变性是变分近似的一个缺点,然而,它是直接可控的,取决于一组透明且易于修改的假设。注意,变量参数应首先转换为无约束空间,即在对数尺度上的标准差,并不需要雅可比行列式。的支撑在实轴,所以多元正态分布为一个合适的变分分布。原创 2023-12-29 18:28:02 · 906 阅读 · 0 评论 -
MCMC抽样:MH算法python实现
当你取得平衡之后,各个状态之间的相互的转移行为是处于一种平衡态上的,即转移出去的量和转移进来的量是相等的。也可以看成是在做某种平衡的物质交换。,然后运行这条马氏链直到达到稳态,从这一时刻之后起,生成的每一个随机数都可以当做我们的采样样本。如果这两个要素都确定了,这个链的转移行为就被完全确定下来了。其实只要基于细致平衡方程,我们不难从物质交换的角度理解。如果这件事情能够做到,而我们的目标是想要获得服从分布。不难看成是先单位化,再确定一个放缩量,使之达到和。但是我学的时候一直存在一个疑问,就是。原创 2024-01-03 18:03:29 · 692 阅读 · 0 评论 -
常见的共轭先验分布
经常会遇到后验分布不能求解的问题,对于这个问题可以应用共轭先验分布解决,这些先验分布具有比较好的特征,能够使得出的后验分布和先验分布具有相同的分布族。分别是先验分布和后验分布的参数。对一些常用的共轭分布进行总结,表4-1 对最重要的共轭分布进行概述。也属于相同的分布族。可以表示为,如果先验分布为。的先验分布,则生成的后验分布。原创 2024-01-04 10:50:59 · 431 阅读 · 0 评论 -
【文献阅读】A random-effects Wiener degradation model based on accelerated failuretime
注意,如果我们让ζ→+∞,所提出的模型退化到常用的维纳过程模型,没有随机效应(方差为0,即恒为均值)。受到这个想法的启发,退化路径中的单位特定的随机效应可以被建模为导致时间轴的随机缩放的随机加速度效应。其次,随机尺度因子引入了观察到的漂移率与扩散系数之间的依赖关系,这适应了实践中常见的现象,即降解率较大的单元往往具有较大的变化[28]。例如,在复杂系统的预测和运行状况管理中,可以使用运行中的测量的退化信号来更新v的条件分布,以监测系统的运行状况状态。从图中,我们看到,估计的路径符合两个应力水平的退化观察。原创 2024-01-07 16:46:25 · 1575 阅读 · 0 评论