数学方法
文章平均质量分 82
schneesnow
这个作者很懒,什么都没留下…
展开
-
测量标准误(Standard Error of Measurement;SEm)
举例:分数不能代表一切,也就是说分数不能完全反映一个学生对知识的掌握情况。没休息好,身体不舒服都可能影响书面成绩,那么考试的分数和学生真实分数存在偏差。如何量化考试(测量手段)说明的学生水平误差就用到了测量标准误。心理领域定义:对特定的一组考生来说,与考试分数有关的测量误差的标准差。测量标准误是衡量测量中误差大小的客观指标。它广泛应用在教育、心理等领域。计算公式如(1),SEm=S1−rxx(1)SEm=S \sqrt{1-r_{xx}} \tag1SEm=S1−rxx(1)其中,SSS代表原创 2021-01-27 11:42:17 · 6478 阅读 · 0 评论 -
贝叶斯自举法(BayesianBootstrap)简介
本文有目录自举法Bootstrap分类频率派自举法贝叶斯自举法为什么贝叶斯自举法贝叶斯自举法的工作原理参考文献自举法Bootstrap分类在对数据的统计分析时,一般首先假设参数形式的概率密度分布。但是如果我们的统计模型对这个预先假设很敏感,那么如何决定假设的内容就很重要了。避免对数据特征的事先假设似乎可以解决上述问题,事实上它也一直是一个重要课题。确定模型的不确定区间可以很好地评价我们模型的可靠度,同时也可以告诉我们模型不知道的范围。自举法概念清晰,执行简单,是一种很好地非参数方法。按照频率派和贝叶原创 2021-01-22 11:35:27 · 4825 阅读 · 1 评论 -
Diebold-Mariano检验
给定两个预测的预测结果,我们希望比较他们的预测结果,以用于预测模型精度的比较。Diebold-Mariano检验本质是一个t检验,用于检验替代预测的两个损失序列的平均值是否相等。即,它是一系列损失差的零均值的t检验。在存在自相关的情况下,它使用损失差分时间序列标准差的自相关一致性估计。注意,在使用DM检验式时,假设损失序列是平稳的。另外,DM检验在小样本数据时往往会拒绝零假设。对于小样本数据,推荐Harvey, Leybourne and Newbold (HLN)检验【1】;参考文献【1】htt原创 2021-01-20 16:07:39 · 5409 阅读 · 4 评论 -
Van der Waerden‘s Normal Scores检验
文章目录简介计算过程参考文献简介Van der Waerden’s Normal Scores检验是一种非参数检验方法。在计算过程中,它首先把数据转换秩序,然后再转换成标准的正态分布分位数。因此它可以适用于非正态分布。零假设H0H_0H0:所有k个总体分布函数都是相等的;备择假设H1H_1H1:在k个总体分布函数中,至少有一个与其它分布不相等,并且倾向对其他分布函数产生更大的观测值。计算过程正态得分AijA_{ij}Aij可按下式计算,Aij=Φ−1(R(Xij)N+1)A_{ij} =原创 2020-09-30 21:21:48 · 999 阅读 · 0 评论 -
t Location-Scale Distribution
文章目录1. Location-Scale t简介1.1.分布形式1.2.分布性质2. t Location-Scale Distribution与标准学生t分布区别3.参考文献1. Location-Scale t简介1.1.分布形式Location-Scale t 分布的概率密度函数f(x)f(x)f(x)可写作如下形式,f(x)=Γ(ν+12)σνπΓ(ν2)[ν+(x−μσ)2ν]−ν+12f(x)=\frac{Γ(\frac{ν+1}2)}{σ\sqrt{νπ}Γ(\frac{ν}2)原创 2020-09-27 11:40:54 · 4461 阅读 · 1 评论 -
变分自编码器入门(Variational Auto Encoder, VAE)
学习体会如下图,我们假设头像图片的有三个特征X=(x1,x2,x3)X=(x_1,x_2,x_3)X=(x1,x2,x3),(比如说x1x_1x1代表脸型,x2x_2x2代表眼睛,x3x_3x3代表嘴巴,这里选三个只是方便理解),确定值描述就是中间的坐标轴,每个特征都有确定的值;但在VAE中每个固定值是不存在的,而是以概率密度的形式存在。XXX为隐变量ZZZ可能的值的一个。所谓道生一,一衍万物,不外如是。一组确定的值限制了我们的想象空间,通过隐函数的空间,大千变化才有了可能。所谓隐函数参照原创 2020-09-08 17:08:40 · 720 阅读 · 0 评论 -
LATEX-拉泰赫编辑数学公式效果展示
Ⅰ上下标1.简单上下标。Aij=2i+jA_{ij} = 2 ^ {i+j}Aij=2i+j2.上下标符号的先后顺序不影响表达 。Aik=BikA_i^k=B^k_iAik=Bik3.\cdot代表点4⋅⋅34^{\cdot{\cdot^3}}4⋅⋅34.符号’等价于(^\prime)。注意\prime没有上下标之说。a=a′a=a^\primea=a′同a=a′a=a'a=a′c′2{c'}^2c′25.角度符号\circ,注意实际应用中加上上标符号^。A=90∘A=90^\原创 2020-09-01 21:51:10 · 1785 阅读 · 0 评论 -
交叉小波分析的解读
通过交叉小波分析,不仅能够分析出信号间的相互关系程度,还可以得到信号在时频空间的相位关系。在变换系数较大的区域代表两信号具有较强的相关性。云图代表周期,箭头代表相位关系。黑色粗轮廓表示95%显著性水平,黑色线条为影响锥。向右箭头表示两信号相同时,向左箭头表示反相信号;向下箭头表示指数领先于指数,向上箭头表示指数落后于指数。...原创 2020-08-24 15:34:48 · 11901 阅读 · 8 评论 -
去趋势波动分析 (Detrended fluctuation analysis ;DFA)
DFA是一种由Peng等人(1994)引入用于DNA研究的长期幂律关系技术;它也适用于非平稳时间序列数据集。该技术已广泛应用于分析连续发展后的自然环境之间的长期关系。从动力学角度看, 这种方法中变换的序列仍残留着原序列的痕迹, 与原序列保持着相同的持久性 (或反持久性) 。同时, 变换可较好地“滤除”其自身演化的趋势成分, 剩下的离差序列主要就是波动成分【3】。计算方法与步骤参照参考文献【3】。这里补充一下DFA指数(a)代表的意义,如果a等于0.5,表示过程是随机分布的,有独立随机方法。如果0 &原创 2020-08-24 11:50:21 · 11655 阅读 · 1 评论 -
Circular-Circular 和 Circular-Linear Regression
Circular-Circular的例子在一个海边的小岛上有着某种稀缺鱼类,科学家关注这种鱼的产卵时间(TS)是否取决于低潮时间(TLT)。在产卵期,科学家甩了几个小硕士在岛上记录了一波实验数据[TSi,TLTi]。为了研究TS对TLT的依赖关系,科学家将这波数据甩给了某个秃头的延期博士。该博士将TS的0 ~ 24小时的周期转换为[0,24];将TLT转换为相位区间[0,2π]。因此配对的TS和TLT是二元循环数据。如下图,它们被绘制成圆圈。根据文献【1】,可分析TS对TLT的统计相干性,若存在显原创 2020-08-20 15:49:22 · 632 阅读 · 1 评论 -
Binning method
Binning method分箱法(不知道咋翻译)用于平滑数据或处理有噪声的数据。在这种方法中,首先对数据进行排序,然后将排序后的值分布到多个桶或箱中。它们执行局部平滑的规则如下,1.按均值平滑。每个bin里的数值都等价于这个bins里数值的均值。2.按中位数平滑。每个bin里的数值都等价于这个bins里数值的中位数。3.按边界平均。①确定每个bin的最大值和最小值。②对于bin里的数值,若其靠近最大值则等价到最大值。如若靠近最小值,则等价为最小值。参考文献【1】Python代码...原创 2020-08-07 16:26:51 · 2023 阅读 · 0 评论 -
Chi-Plots和Kendall Plots
简介参照参考文献【1】和【2】怎么看Chi-plot上图中第一列图表示两变量X和Y的散点图,第二列表示Chi-plot。第一行图到第四行图中X,Y的相关性分比为0.0, 0.2, 0.5,和 0.95。由图可知在Chi-plot中,若散点都在两条横线之间,则相关性接近0。在第一条横线上表示正相关,在第三条线下表示负相关。λi表示(Xi,Yi)到数据集中心(以X,Y的中位数表示)的距离。具体怎么画,可以参照CRAN。怎么看Kendall Plots如上图,左图Y=1-X,右图Y=X,若点落到1原创 2020-08-06 23:24:50 · 2301 阅读 · 2 评论 -
分位数回归的实现方法
目录分位数回归简介实现方法参考文献分位数回归简介简介参照可参照参考文献【】实现方法MATLAB: quantregR package:quantreg[外链图片转存失败,源站可能有防盗图片保存下来直1]Dhttps://px1dujblog.c-dnimg.cn/202008564328801.oss-process=image/watermark,type_ZmFuZ3poZWpg?x700naGVpdGk,shadow_10,text_aHR0cHM6Ly7ibG9nLmNzZG4ubmV0原创 2020-08-06 17:04:01 · 4378 阅读 · 1 评论 -
看的见的高斯过程【转】
https://www.jgoertler.com/visual-exploration-gaussian-processes/http://www.360doc.com/content/19/0217/14/32196507_815537751.shtml#转载 2020-07-08 19:30:39 · 151 阅读 · 0 评论 -
基于matlab的自定义最大似然函数的求参方法
1.已知对数似然函数,利用fminunc函数搜索极值。【1】function [ll] = neg_loglike(theta,Y,X) %定义neg_loglike.m方程 mu = X*theta(1:2); ll = -1*sum(log(normpdf(Y,mu,theta(3)))); %fminunc默认求最小值,调整end%% 假设每次观测独立,代入f(观测|参数)数据。data = csvread('/tmp/data.csv'); X = data(:,[3 1原创 2020-06-26 20:56:09 · 5792 阅读 · 1 评论 -
统计检验选取指南
文章目录0 意义1 方法路线2 case study0 意义统计作为分析的必备方法,备受人们的瞩目与喜爱。统计检验让我们从概率的角度评判到不同组的差异是否明显。但对于如何选取统计检验让非统计专业的人们一头雾水。本文列处统计检验的选择方法与适用范围。不足之处,恳请批评指正。1 方法路线以t检验为例,一般选取Shapiro.test来评判数据正态性是否满足。若 p-value = 0.551&...原创 2020-01-06 10:55:34 · 971 阅读 · 0 评论 -
置信区间计算方法
文章目录1 均值的置信区间2标准差的置信区间3偏度的置信区间参考文献画图加个阴影,需要用到置信区间的计算方法。SPSS和R应该都能算,这里简单罗列下三阶统计的计算方法。1 均值的置信区间以前保存的一个表格,来源未知。补充,对于非正态的数据的小样本数据,参考[这里]。(https://newonlinecourses.science.psu.edu/stat414/node/261/)2标...原创 2019-11-11 22:50:05 · 15719 阅读 · 0 评论