数据科学-数学部分
文章平均质量分 88
统计与概率,线性代数,高等数学,离散数学
宁滴爹地
这个作者很懒,什么都没留下…
展开
-
Bootstrapping method
引用自Bootsrapping指的就是利用有限的样本资料经由多次重复抽样,重新建立起足以代表母体样本分布的新样本。统计中我们常常需要做参数估计,具体问题可以描述为:给定一系列数据,假设它们是从分布中采样得到的,参数估计就是希望估计分布中的。bootstrapping算法的目的就是为了估计从而得到的分布的预测。具体地,它的思想对已有的观测值进行多次重复的抽样,每次抽样都可以得到一个预测的经验分布函数,根据这些不同抽样得到的经验分布函数,可以得到一个更好的关于统计量分布的估计。打个比方,如果现在有N个原创 2021-01-05 15:14:14 · 2530 阅读 · 1 评论 -
数据分析and数据科学必须掌握的分布
1 二项分布 Binomial Distribution特殊情况:0-1分布,又叫两点分布,伯努利实验(二项分布):式中k=0,1,2,…,n,是二项式系数(这就是二项分布名称的由来)。X~B(n,p) 期望E(x)=np,方差D(x)= np(1−p) 【方差也可以写作V(x),Var(X)】2 泊松分布 Poisson Distribution泊松分布成立的条件:二项、独立、等概率E(x) = V(x) = λ特殊地,当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,原创 2020-10-22 14:51:33 · 314 阅读 · 0 评论 -
概率分布函数,概率密度函数
引用自 应该如何理解概率分布函数和概率密度函数?概率密度函数:想象有一个无限长的杆,总质量为1,概率密度就是某个点处的质量密度。先从离散型随机变量和连续性随机变量说起对于如何分辨离散型随机变量和连续性随机变量,我这里先给大家举几个例子:1、一批电子元件的次品数目。2、同样是一批电子元件,他们的寿命情况。在第一个例子中,电子元件的次数是一个在现实中可以区分的值,我们用肉眼就能看出,这一堆元件里,次品的个数。但是在第二个例子中,这个寿命它是一个你无法用肉眼数的过来的数字,它需要你用笔记下来,变成一转载 2021-01-08 16:41:54 · 1185 阅读 · 0 评论 -
协方差Covariance 相关系数correlation coefficient 和 方差-协方差矩阵variance-covariance matrix
一 协方差 Covariance协方差一般刻画两个随机变量的相似程度。方差是协方差的一种特殊情况,即当两个变量是相同的情况。计算公式如下。 取值范围 R域 当协方差Cov(X,Y)>0时,称X与Y正相关 当协方差Cov(X,Y)<0时,称X与Y负相关 当协方差Cov(X,Y)=0时,称X与Y不相关 cov(x,x)=V(x)如果X与Y是统计独立的,那么二者之间的协方差就是0,因为两个独立的随机变量满足E[XY]=E[X]E[Y]。但是,反过来并不成立。即如果原创 2020-10-18 15:48:28 · 6549 阅读 · 1 评论