概率统计
文章平均质量分 95
概率统计问题Python计算
戌崂石
这个作者很懒,什么都没留下…
展开
-
概率统计Python计算导引
教学中积攒了几十篇用Python的科学计算包numpy、sicipy、matplotlib等计算《概率论与数理统计》课程中问题的短文,写成博文。希望能为学习概率统计,入门数据分析的朋友提供参考。博大精深,本系列博文所涉及的应用课题如九牛一毛。博文中的自定义函数,建议读者将其写入一个代码文件,在不同的场合调用前导入,比较方便。为便于读者参阅,今按概率统计课程的教学顺序,将所有博文开列成链接目录如下。(点击链接可从中下载),其中的Jupyter或Spyder更便于科学计算程序的开发、调试。原创 2021-06-19 08:49:58 · 1946 阅读 · 1 评论 -
概率统计Python计算:条件概率和概率乘法公式
1. 古典概型中条件概率的计算根据条件概率的计算公式P(B∣A)=P(A∩B)/P(A)P(B|A)=P(A\cap B)/P(A)P(B∣A)=P(A∩B)/P(A),在古典概型下,我们定义如下的Python函数:def condP(A, B): #事件B发生的条件下A的概率 return len(A & B) / len(B)程序中定义的函数condP(A,B)只适合于计算古典概型中的条件概率P(A∣B)P(A|B)P(A∣B)。代码很简单,为求条件原创 2021-05-01 17:29:25 · 4475 阅读 · 5 评论 -
概率统计Python计算:按条件设置随机事件
作为样本空间子集的随机事件可以由样本空间中的样本点满足一定的条件来确定。为方便应用,我们设计如下的函数来为指定样本空间设置指定条件的随机事件:def setEvent(S, condition=None): #设置符合条件condition的事件 A = set() #A初始化为空集 for x in S: #样本空间中找符合条件的样本点 if condition(x):原创 2021-05-01 15:32:38 · 2011 阅读 · 3 评论 -
概率统计Python计算:排列组合——构造样本空间
当试验的样本空间中样本点结构比较复杂时,需要仔细构造样本空间。例如,向目标射击3枪,观察每一枪是否击中目标的试验,如果将射中目标记为1,未击中目标记为0,则一个样本点可表示为一个3元组(i,j,k)(i,j,k)(i,j,k)。其中的每个分量取值为0或1。这样样本空间可以视为对有限集合{0,1}\{0, 1\}{0,1},作具有3个元素 的可重排列构成的集合。再比如从3黑2白的5球中任取3球观察其颜色的试验,若用若用1-3表示黑球,4~5表示白色球。样本点可表为3元组(i,j,k)(i,j,k)(i,j,k原创 2021-05-01 15:31:04 · 1537 阅读 · 1 评论 -
概率统计Python计算:解古典概型问题
系列文章目录提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录古典概型与几何概型问题的Python解法1. 解古典概型问题2. 解2-维几何概型问题古典概型与几何概型问题的Python解法1. 解古典概型问题假定以SSS为样本空间的随机试验是一个等概模型,事件A⊆SA\subseteq SA⊆S。若能算得∣S∣=n|S|=n∣S∣原创 2021-04-30 20:01:41 · 1554 阅读 · 5 评论 -
概率统计Python计算:解2-维几何概型问题
对于2-维空间的几何概型,其中事件的概率须通过计算平面区域的面积才能求得。由函数曲线围成的区域D={(x,y)∣a≤x≤b,f1(x)≤y≤f2(x)}D=\{(x, y)|a\leq x\leq b, f_1(x)\leq y\leq f_2(x)\}D={(x,y)∣a≤x≤b,f1(x)≤y≤f2(x)},其面积我们可以用二重积分求得:D的面积=∬Ddσ=∫ab(∫f1(x)f2(x)dy)dxD\text{的面积}=\iint\limits_Dd\sigma=\int_a^b\left(\in原创 2021-05-01 16:29:55 · 996 阅读 · 1 评论 -
概率统计Python计算:随机变量的分布函数
任何随机变量XXX都有其分布函数(或称为累积分布函数)F(x)=P(X≤x),x∈(−∞,+∞).F(x)=P(X\leq x), x\in (-\infty,+\infty).F(x)=P(X≤x),x∈(−∞,+∞).例1 向半径为rrr的圆内任一投掷一个点,求此点到圆心的距离XXX的分布函数,并计算P(X>r/2)P(X>r/2)P(X>r/2)。解:显然,这是一个2-维几何概型,XXX的取值范围为[0,r][0,r][0,r]。当x<0x<0x<0时,X≤x原创 2021-05-02 17:03:49 · 2247 阅读 · 6 评论 -
概率统计Python计算:标准正态分布分位点计算
标准正态分布对给定显著水平的分位点。设XXX~{}N(0,1)N(0,1)N(0,1),显著水平为α\alphaα。为计算右侧分位点zαz_{\alpha}zα(见下图),使得P(X≤zα)≥1−αP(X\leq z_\alpha)\geq1-\alphaP(X≤zα)≥1−α由标准正态分布密度函数φ(x)=12πe−x22\varphi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}φ(x)=2π1e−2x2关于纵轴的对称性,对给定的显著水平α\alp原创 2021-05-09 11:04:07 · 18139 阅读 · 2 评论 -
概率统计Python计算:卡方分布分位点计算
自由度为nnn的χ2\chi^2χ2分布的密度函数f(x)={12n/2Γ(n/2)xn2−1e−x2x≥00x<0.{f(x)=}\begin{cases} \frac{1}{2^{n/2}\Gamma(n/2)}x^{\frac{n}{2}-1}e^{-\frac{x}{2}}&x\geq0\\ 0&x<0\end{cases}.f(x)={2n/2Γ(n/2)1x2n−1e−2x0x≥0x<0.下图展示了自由度nnn分别为2,4,6的原创 2021-05-09 16:52:08 · 12908 阅读 · 7 评论 -
概率统计Python计算:离散型2-维随机向量的联合分布律及边缘分布
此处,我们假定2-维离散型随机向量(X,Y)(X, Y)(X,Y)的联合分布律为即随机变量XXX取mmm个值,YYY取nnn个值,将(X,Y)(X, Y)(X,Y)的联合分布中的概率值构成一个m×nm\times nm×n的矩阵,记为PXYP_{XY}PXY,即PXY=(p11p12⋯p1np21p22⋯p2n⋮⋮⋯⋮pm1pm2⋯pmn)P_{XY}=\begin{pmatrix}p_{11}&p_{12}&\cdots&p_{1n}\\p_{21}&p_{22原创 2021-05-06 10:15:19 · 9430 阅读 · 5 评论 -
概率统计Python计算:离散型随机变量分布(binom & poisson)
1. binom分布(二项分布)scipy.stats包中的binom类对象是表示二项分布的。常用的四个函数说明见下表。函数名参数功能rvs(n, p, size)n,p:分布参数,size:产生的随机数个数,缺省值为1产生size个随机数pmf(k, n, p)k:随机变量取值,n,p:与上同概率质量函数(分布律)P(X=k)P(X=k)P(X=k)cdf(k, n, p)k:分布函数自变量,n,p:与上同累积概率函数(分布函数)F(k)F(k)F(k)原创 2021-05-03 19:29:27 · 10231 阅读 · 3 评论 -
概率统计Python计算:离散型随机变量分布(bernoulli & geom)
Python的scipy.stats包中提供了各种随机变量的分布。每一种分布,其累积分布函数(分布函数)记为cdf。离散型变量分布的概率质量函数(分布律),记为pmf。除此之外,每个分布都有一个服从该分部变量发生器函数rvs,用来产生服从该分布的随机数。1. bernoulli分布(0-1分布)Python的scipy.stats包中,bernoulli类就是用来表示伯努利分布的。常用的三个函数说明见下表。函数名参数功能rvs(p, size)p:分布参数,size:产生的随原创 2021-05-02 21:07:59 · 3401 阅读 · 0 评论 -
概率统计Python计算:连续型随机变量分布(uniform & expon)
1. uniform分布(均匀分布)Python的scipy.stats包中的对象uniform表示连续型的均匀分布。下表展示了uniform分布的几个常用函数。函数名参数功能rvs(loc, scale, size)loc:分布参数aaa,缺省值为0, scale:分布参数差b−ab-ab−a,缺省值为1,size:产生的随机数个数,缺省值为1产生size个随机数pdf(x, loc, scale)x:自变量取值,loc,scale:与上同概率密度函数f(x)f(x原创 2021-05-04 14:47:49 · 3926 阅读 · 0 评论 -
概率统计Python计算:连续型随机变量分布(norm)
scipy.stats的norm对象表示正态分布,下表说明norm的几个常用函数。函数名参数功能rvs(loc, scale, size)loc,scale:分布参数μ\muμ和σ\sigmaσ,缺省值分别为0和1,size:产生的随机数个数,缺省值为1产生size个随机数pdf(x, loc, scale)x:自变量取值,loc,scale:与上同概率密度函数f(x)f(x)f(x)cdf(x, loc, scale)x,loc,scale:与上同累积概率函原创 2021-05-04 16:02:49 · 4095 阅读 · 0 评论 -
概率统计Python计算:自定义连续型分布
与rv_discrete类相仿,scipy.stats还提供了一个表示连续型分布的rv_continuous类。使用rv_continuos类自定义连续型分布甚至比用rv_discrete类自定义离散型分布更简单:只需要自定义分布的累积概率函数(分布函数)cdf即可。例如,在《随机变量的分布函数》一文的例1中,我们曾遇到向半径为rrr的圆内投掷一点,点到圆心距离的随机变量XXX的分布函数为F(x)={0x<0x2r20≤x≤r1x>r{F(x)=}\begin{cases} 0&am原创 2021-05-05 15:49:06 · 1634 阅读 · 0 评论 -
概率统计Python计算:离散型随机变量函数分布
设已知离散型随机变量XXX的分布律P(X=xk)=pkP(X=x_k)=p_kP(X=xk)=pk,k=1,2,⋯k=1,2,\cdotsk=1,2,⋯及函数Y=g(X)Y=g(X)Y=g(X)为计算YYY的分布律,先算得序列{g(x1),g(x2),⋯ }\{g(x_1), g(x_2), \cdots\}{g(x1),g(x2),⋯},对其中的每一个值g(xk)g(x_k)g(xk)若有{g(xk1),g(xk2),…,g(xki)}\{g(x_{k_1}), g(x_{k_2}),\dots原创 2021-05-04 20:46:18 · 1608 阅读 · 4 评论 -
概率统计Python计算:连续型随机向量边缘分布或条件分布概率计算
对于边缘分布和条件分布而言,密度函数都是一元函数。为计算随机变量取值落入指定区间I=(a,b)I=(a, b)I=(a,b)的概率P(X∈I)=∫abf(x)dxP(X\in I)=\int_{a}^{b}f(x)dxP(X∈I)=∫abf(x)dx,可以调用scipy.integrate包中的quad函数。该函数的调用接口为:quad(f, a, b)\text{quad(f, a, b)}quad(f, a, b)其中,参数f表示被积函数f(x)f(x)f(原创 2021-05-07 15:43:13 · 1983 阅读 · 2 评论 -
概率统计Python计算:全概率公式
1. numpy数组的按元素计算设完备事件组A1,A2,⋯ ,AnA_1,A_2,\cdots,A_nA1,A2,⋯,An作为引发事件BBB的nnn个因素。诸因素的先验概率构成的序列为P(A1),P(A2),⋯ ,P(An)P(A_1),P(A_2),\cdots,P(A_n)P(A1),P(A2),⋯,P(An),在诸因素AiA_iAi发生的条件下,事件BBB的似然度构成序列P(B∣A1),P(B∣A2),⋯ ,P(B∣An)P(B|A_1),P(B|A_2),\cdots,P(B|A_n原创 2021-05-02 11:44:36 · 4667 阅读 · 1 评论 -
概率统计Python计算:离散型随机向量条件分布计算
计算2-维离散型随机向量(X,Y)(X,Y)(X,Y)的条件分布律,譬如P(X∣Y=yj)P(X|Y=y_j)P(X∣Y=yj),就是用YYY的边缘分布中的P(Y=yj)=p⋅jP(Y=y_j)=p_{\cdot j}P(Y=yj)=p⋅j遍除联合分布律中第jjj列中每个元素pijp_{ij}pij,i=1,2,⋯ni=1, 2, \cdots ni=1,2,⋯n。即(p1j/p⋅jp2j/p⋅j⋮pmj/p⋅j),j=1,2,⋯ ,n\begin{pmatrix} p_{1j}/p_{\cdot原创 2021-05-06 16:16:03 · 1116 阅读 · 0 评论 -
概率统计Python计算:学生分布分位点计算
设XXX~N(0,1)N(0,1)N(0,1),YYY~χ2(n)\chi^2(n)χ2(n),且XXX与YYY相互独立,则XY/n\frac{X}{\sqrt{Y/n}}Y/nX~t(n)t(n)t(n)。即XY/n\frac{X}{\sqrt{Y/n}}Y/nX服从自由度为nnn的学生分布,其密度函数为h(x)=Γ(n+12)nπΓ(n2)(1+x2n)−n+12h(x)=\frac{\Gamma\left(\frac{n+1}{2}\right)}{\sqrt{n\pi}\Gamma\lef原创 2021-05-10 18:44:44 · 2615 阅读 · 1 评论 -
概率统计Python计算:贝叶斯公式
根据完备事件组A1,A2,…,AnA_1, A_2,\dots , A_nA1,A2,…,An的先验概率序列P(A1),P(A2),…,P(An)P(A_1), P(A_2), \dots, P(A_n)P(A1),P(A2),…,P(An),对事件BBB的似然度序列P(B∣A1),P(B∣A2),…,P(B∣An)P(B|A_1),P(B|A_2),…,P(B|A_n)P(B∣A1),P(B∣A2),…,P(B∣An),计算第iii个因素AiA_iAi的后验概率P(Ai∣B)P(A_i原创 2021-05-02 14:54:46 · 2327 阅读 · 1 评论 -
概率统计Python计算:连续型变量的独立性及约会问题解法
设(X,Y)(X, Y)(X,Y)的联合密度函数为f(x,y)f(x, y)f(x,y),联合分布函数为F(x,y)F(x, y)F(x,y),XXX和YYY的边缘密度分别为fX(x)f_X(x)fX(x)和fY(y)f_Y(y)fY(y),边缘分布函数分别为FX(x)F_X(x)FX(x)和FY(y)F_Y(y)FY(y)。我们知道,XXX与YYY相互独立,当且仅当F(x,y)=FX(x)⋅FY(y),(x,y)∈(−∞,+∞)×(−∞,+∞)F(x, y)=F_X(x)\cdot F_Y(y原创 2021-05-07 17:17:00 · 1148 阅读 · 0 评论 -
概率统计Python计算:离散型变量独立性判断
随机变量之间的独立性是非常重要的关系。对离散型随机变量XXX,YYY而言,我们知道XXX,YYY独立,当且仅当pij=pi⋅⋅p⋅j,1≤i≤m,1≤j≤np_{ij}=p_{i\cdot}\cdot p_{\cdot j},1\leq i\leq m, 1\leq j\leq npij=pi⋅⋅p⋅j,1≤i≤m,1≤j≤n。用矩阵表示为(p11p12⋯p1np21p22⋯p2n⋮⋮⋯⋮pm1pm2⋯pmn)=(p1⋅⋅p⋅1p1⋅⋅p⋅2⋯p1⋅⋅p⋅np2⋅⋅p⋅1p2⋅⋅p⋅2⋯p2⋅⋅p⋅原创 2021-05-06 16:36:02 · 3274 阅读 · 2 评论 -
概率统计Python计算:自定义离散型分布
假定有自定义的分布数据(X, P),其中X表示随机变量XXX的取值序列,P表示对应XXX的每个取值的概率序列。scipy.stats包为我们提供了一个rv_discrete类,可以用数据(X, P)创建自定义的离散型随机变量的分布。例如设XXX~(12100.150.550.3)\begin{pmatrix}1&2&10\\0.15&0.55&0.3\end{pmatrix}(10.1520.55100.3),我们用下列代码生成一个以序列X={1, 2, 10},P={原创 2021-05-05 10:58:18 · 2191 阅读 · 2 评论 -
概率统计Python计算:连续型随机变量函数分布
我们知道,对XXX已知的分布函数FX(x)F_X(x)FX(x),若函数Y=g(X)Y=g(X)Y=g(X)具有单调增加的反函数X=g−1(Y)X=g^{-1}(Y)X=g−1(Y),则YYY的分布函数FY(y)=FX(g−1(y)F_Y(y)=F_X(g^{-1}(y)FY(y)=FX(g−1(y)。在Python中,我们也可以通过这样的函数复合方式计算连续型随机变量函数的分布:构造y=g(x)y=g(x)y=g(x)的反函数h(y)=g−1(y)h(y)=g^{-1}(y)h(y)=g−1(y),原创 2021-05-05 20:00:46 · 1445 阅读 · 1 评论 -
概率统计Python计算:自定义分布的方差计算
对于自定义分布,则可根据方差的计算公式,先分别计算出XXX的1阶原点矩E(X)E(X)E(X)和2阶原点矩E(X2)E(X^2)E(X2),然后计算D(X)=E(X2)−[E(X)]2D(X)=E(X^2)-[E(X)]^2D(X)=E(X2)−[E(X)]2。例1 设随机变量XXX的密度函数为f(x)=12e−∣x∣,x∈(−∞,+∞)f(x)=\frac{1}{2}e^{-|x|}, x\in(-\infty, +\infty)f(x)=21e−∣x∣,x∈(−∞,+∞)。计算方差D(X)D(X)D原创 2021-05-13 09:29:56 · 1211 阅读 · 2 评论 -
概率统计Python计算:单个正态总体方差的双侧区间估计
计算指定置信水平下正态总体方差σ2\sigma^2σ2的置信区间,涉及样本方差s2s^2s2,样本容量nnn和置信水平1−α1-\alpha1−α等三个因素。计算步骤为计算χ2(n−1)\chi^2(n-1)χ2(n−1)分布概率为1−α1-\alpha1−α的双侧分位点aaa和bbb;计算分子(n−1)s2(n-1)s^2(n−1)s2;计算下限(n−1)s2/b(n-1)s^2/b(n−1)s2/b和上限(n−1)s2/a(n-1)s^2/a(n−1)s2/a根据这一算法,定义计算正态总体参原创 2021-05-20 09:40:26 · 1232 阅读 · 0 评论 -
概率统计Python计算:中心极限定理的验证
中心极限定理告诉我们,独立同分布的随机变量序列X1,X2,⋯ ,Xn,⋯X_1,X_2,\cdots,X_n,\cdotsX1,X2,⋯,Xn,⋯,若E(Xi)=μE(X_i)=\muE(Xi)=μ,D(Xi)=σ2D(X_i)=\sigma^2D(Xi)=σ2,i=1,2,⋯i=1,2,\cdotsi=1,2,⋯。则limn→∞P(∣∑i=1nXin−μσn∣≤x)=12π∫−∞xe−t22dt.\lim\limits_{n\to\infty}P\left(\bigg|\frac{\frac原创 2021-05-13 19:28:02 · 1282 阅读 · 4 评论 -
概率统计Python计算:用样本均值和方差计算总体参数的点估计
设来自总体XXX的简单样本为(X1,X2,⋯ ,Xn)(X_1, X_2,\cdots,X_n)(X1,X2,⋯,Xn)。样本均值为X‾=1n∑i=1nXi\overline{X}=\frac{1}{n}\sum\limits_{i=1}^nX_iX=n1i=1∑nXi,样本方差为S2=1n−1∑i=1n(Xi−X‾)2S^2=\frac{1}{n-1}\sum\limits_{i=1}^n(X_i-\overline{X})^2S2=n−11i=1∑n(Xi−X)2。用Python的nu原创 2021-05-15 16:59:29 · 2659 阅读 · 2 评论 -
概率统计Python计算:单个正态总体均值的双侧区间估计
我们知道,计算单个总体XXX~N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的参数μ\muμ对给定置信水平1−α1-\alpha1−α的置信区间,除了置信度外,还需要如下几个要素:样本均值x‾\overline{x}x,样本方差s2s^2s2或总体方差σ2\sigma^2σ2,样本容量n。虽然要根据总体σ2\sigma^2σ2是否已知分两种情况计算,但计算步骤几乎是一样的:计算枢轴量分布(已知σ2\sigma^2σ2为N(0,1)N(0,1)N(0,1),未知σ2\sigma^2σ2为t(n原创 2021-05-18 15:19:10 · 2034 阅读 · 1 评论 -
概率统计Python计算:连续型自定义分布数学期望的计算(二)
对自定义的连续型随机变量,设其概率密度函数为f(x)f(x)f(x),我们定义计算函数g(X)g(X)g(X)的数学期望E(g(X))E(g(X))E(g(X))的Python函数如下。from scipy.integrate import quad #导入quaddef expectcont(pdf, func=lambda x:x): #pdf为密度,func为随机变量函数 xf=lambda x:pdf(x)*func(x) #被原创 2021-05-12 15:00:18 · 1996 阅读 · 3 评论 -
概率统计Python计算:总体未知参数的矩估计
设样本(X1,X2,⋯ ,Xn)(X_1,X_2,\cdots,X_n)(X1,X2,⋯,Xn)来自XXX,XXX的分布中含有mmm个未知参数θ1,θ2,⋯ ,θm\theta_1,\theta_2,\cdots,\theta_mθ1,θ2,⋯,θm。设XXX存在直到mmm阶的原点矩E(X),E(X2),⋯ ,E(Xm)E(X),E(X^2),\cdots,E(X^m)E(X),E(X2),⋯,E(Xm)。显然,E(Xk)=μkE(X^k)=\mu_kE(Xk)=μk,仍然含有mmm个参数θ1原创 2021-05-16 11:41:14 · 3405 阅读 · 1 评论 -
概率统计Python计算:样本数据的经验分布函数
设(x1,x2,⋯ ,xn)(x_1,x_2,\cdots,x_n)(x1,x2,⋯,xn)是总体XXX的一个样本观测值。与绘制直方图相仿,记a=min{x1,x2,⋯ ,xn}a=min\{x_1,x_2,\cdots,x_n\}a=min{x1,x2,⋯,xn},b=max{x1,x2,⋯ ,xn}b=max\{x_1,x_2,\cdots,x_n\}b=max{x1,x2,⋯,xn}。将区间[a,b][a, b][a,b]等分成m(≤n)m(\leq n)m(≤n)个小区间,约定除最原创 2021-05-14 21:22:53 · 6153 阅读 · 12 评论 -
概率统计Python计算:单个正态总体方差的单侧区间估计
对函数sigma2Interval(详见博文《单个正态总体方差的双侧区间估计》)稍作修改,就可得到计算总体参数σ2\sigma^2σ2单侧置信上限或下限的函数。from scipy.stats import chi2 #导入chi2分布def sigma2Bound(s2, n, confidence, low=True): #定义函数 alpha=1-confidence #计算置信度中的alpha原创 2021-05-21 20:44:35 · 1064 阅读 · 0 评论 -
概率统计Python计算:经典分布数学期望的计算
我们知道Python的scipy.stats包提供了大量的经典分布(如0-1分布、二项分布、泊松分布,均匀分布,指数分布,正态分布……等等),这些经典分布对象拥有计算数学期望的expect函数,该函数的调用接口为expect(func=x, args).\text{expect(func=x, args)}.expect(func=x, args).传递正确的分布参数给args就能计算指定随机变量的数学期望值,参数func的缺省值为自变量xxx,传递指定函数即可计算随机变量函数的期望原创 2021-05-11 19:23:36 · 6939 阅读 · 2 评论 -
概率统计Python计算:单个正态总体均值的单侧区间估计
计算单个总体XXX~N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的参数μ\muμ对给定置信水平1−α1-\alpha1−α的单侧置信区间,方法与计算双侧置信区间大同小异。计算枢轴量分布(已知σ2\sigma^2σ2为N(0,1)N(0,1)N(0,1),未知σ2\sigma^2σ2为t(n−1)t(n-1)t(n−1))概率为置信度1−α1-\alpha1−α的单侧分位数aaa或bbb;计算增量因子ddd(已知σ2\sigma^2σ2为σ2n\sqrt{\frac{\sigma^2}{n原创 2021-05-19 15:38:27 · 1980 阅读 · 1 评论 -
概率统计Python计算:协方差与相关系数计算
我们知道,若随机向量(X,Y)(X,Y)(X,Y)存在E(X)E(X)E(X),E(Y)E(Y)E(Y),E(XY)E(XY)E(XY),则存在(X,Y)(X,Y)(X,Y)的协方差Cov(Y,X)\text{Cov}(Y, X)Cov(Y,X):Cov(Y,X)=E[(Y−E(Y))(X−E(X))]=E(XY)−E(X)E(Y).\text{Cov}(Y, X)=E[(Y-E(Y))(X-E(X))]=E(XY)-E(X)E(Y).Cov(Y,X)=E[(Y−E(Y))(X−E(X))]=E(XY)−原创 2021-05-13 12:07:16 · 2658 阅读 · 4 评论 -
概率统计Python计算:随机变量的线性回归
若随机向量(X,Y)(X,Y)(X,Y)存在相关系数ρXY\rho_{XY}ρXY,由E[(Y−(aX+b))2]=D(Y)+a2D(X)−2aCov(Y,X)+(E(Y)−aE(X)−b)2=D(Y)(1−ρXY2)+D(X)(a−ρXYD(Y)D(X))2+(E(Y)−aE(X)−b)2E[(Y-(aX+b))^2]=D(Y)+a^2D(X)-2a\text{Cov}(Y, X)+(E(Y)-aE(X)-b)^2\\ =D(Y)(1-\rho_{XY}^{2})+D(X)\left(a-\r原创 2021-05-13 15:50:13 · 563 阅读 · 5 评论 -
概率统计Python计算:F分布分位点计算
设XXX,YYY相互独立,且分别服从χ2(m)\chi^2(m)χ2(m)和χ2(n)\chi^2(n)χ2(n),则XY\frac{X}{Y}YX~F(m−1,n−1)F(m-1, n-1)F(m−1,n−1),即XY\frac{X}{Y}YX服从自由度为mmm和nnn的FFF分布。服从F(m−1,n−1)F(m-1, n-1)F(m−1,n−1)分布的随机变量XXX的概率密度函数为ψ(x)={Γ(m+n2)(mn)m2xm2−1Γ(m2)Γ(n2)(1+mnx)m+n2x≥00x<0{\ps原创 2021-05-10 19:52:16 · 14418 阅读 · 3 评论 -
概率统计Python计算:样本数据直方图绘制
对总体XXX的一次具体抽样,得到一个容量为nnn的样本观测值(x1,x2,⋯ ,xn)(x_1,x_2,\cdots,x_n)(x1,x2,⋯,xn)。记a=min{x1,x2,⋯ ,xn}a=min\{x_1,x_2,\cdots,x_n\}a=min{x1,x2,⋯,xn},b=max{x1,x2,⋯ ,xn}b=max\{x_1,x_2,\cdots,x_n\}b=max{x1,x2,⋯,xn}。将[a,b][a, b][a,b]等分成mmm个小区间Δk\Delta_kΔk(为方便原创 2021-05-14 17:09:13 · 2752 阅读 · 1 评论