![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
我的统计学复习日记
舟晓南
国内某头部量化金融公司就职,数据分析,机器学习,深度学习经验分享
展开
-
数据分析统计学原理第十四章:简单线性回归 | 我的统计学原理复习日记
因变量( dependent variable):被预测的变量自变量( independent variable):用来预测因变量值的一个或多个变量简单线性回归( simple linear regression):包括一个自变量和一个因变量,二者之间的关系可以用一条直线近似表示。回归模型( regression model):描述y如何依赖于x和误差项的方程描述y的期望值E(y)如何依...原创 2020-05-04 12:31:16 · 1562 阅读 · 0 评论 -
数据分析统计学原理第十三章:实验设计与方差分析 | 我的统计学原理复习日记
统计研究可以分为实验性研究与观测性研究两类。在实验性统计研究中,数据是通过实验产生的。一项实验首先要从确定一个我们感兴趣的变量开始。然后确定并控制一个或多个其他变量,这些其他变量与我们感兴趣的变量是相关的;与此同时,收集这些变量如何影响我们感兴趣的那一个变量的数据。在观测性研究中,我们经常是通过抽样调查,而不是控制一项实验来获取数据。一些好的设计原则仍然会得到使用,但严格控制一项实验性统计研究往...原创 2020-04-19 15:34:25 · 2291 阅读 · 0 评论 -
数据分析统计学原理第十二章:多个比例的比较、独立性及拟合优度检验 | 我的统计学原理复习日记
个或多个总体比例的相等性的检验例子:三个或多个总体比例相等性的卡方检验的一般步骤多重比较方法我们使用卡方检验得到三个汽车车主总体的总体比例不全相等的结论。因此,有些总体比例之间存在差异,而且研究表明雪佛兰羚羊、福特 Fusion和本田雅阁车主中顾客品牌忠诚度不全相同。为了说明总体比例之间存在的差异,我们先计算三个样本比例。由于卡方检验表明总体比例不全相等,因此,我们尝试性地确定哪...原创 2020-04-18 17:17:28 · 6448 阅读 · 0 评论 -
数据分析统计学原理第十一章:总体方差的统计推断 | 我的统计学原理复习日记
一个总体方差的统计推断样本方差是总体方差的点估计区间估计利用卡方分布建立总体方差的置信区间估计根据下式可以得到区间估计上式可转变为则总体方差的区间估计式为假设检验例子:汇总两个总体方差的统计推断在一些统计应用中,我们可能想比较两个不同生产工序生产出来的产品质量的方差、两种不同装配方法所需装配时间的方差或者两种加热装置温度的方差。例子:汇总...原创 2020-04-15 11:03:01 · 505 阅读 · 1 评论 -
数据分析统计学原理第十章:两总体均值和比例的推断 | 我的统计学原理复习日记
两总体均值之差的推断:总体标准差1和2已知的情况为了进行有关差异的统计推断,我们从总体1中抽取一个容量为n1的简单随机样本,从总体2中抽取另一个容量为n2的简单随机样本。由于这两个样本是相互独立抽取的,因此被称为独立简单随机样本( independent simple random samples)总体平均值之差的区间估计两个总体均值之差的点估计量总体均值之差的假设检验两总体均值之...原创 2020-04-14 10:46:36 · 1544 阅读 · 0 评论 -
数据分析统计学原理第九章:假设检验 | 我的统计学原理复习日记
假设检验是一种在统计推断中来确定是否应拒绝关于总体参数值的方法。在假设检验中,我们首先对总体参数做一个尝试性的假设,该尝试性的假设被称为原假设( null ypothesis),记作H0,然后,定义另一个与原假设的内容完全对立的假设,称之为备择假设( alternative hypothesis),记作Ha,假设检验的过程就是根据样本数据对这两个对立的假设H0和Ha进行检验。假设的选择将研...原创 2020-04-13 16:23:21 · 2011 阅读 · 1 评论 -
数据分析统计学原理第八章:区间估计 | 我的统计学原理复习日记
我们发现点估计量是用于估计总体参数的样本统计量。例如,样本均值是总体均值的点估计量,样本比率是总体比率的点估计量。因为我们不可能期望点估计量能给出总体参数的精确值,所以经常在点估计上加减一个被称为边际误差( marginal of error)的值来计算区间估计( interval estimate)。区间估计的一般形式如下:总体均值的区间估计:总体标准差已知情形计算样本的标准差需要95...原创 2020-04-11 14:18:22 · 3497 阅读 · 0 评论 -
数据分析统计学原理第七章:抽样和抽样分布 | 我的统计学原理复习日记
我们选取样本是为了收集推断所需的数据,并且回答关于总体的研究问题。抽样结果提供的仅仅是相应总体特征值的估计。样本只包含了总体的一部分,可以预见会有抽样误差。抽样总体( sampled population):从中抽取样本的总体抽样框( frame):用于抽选样本的个体清单从有限总体的抽样在从有限总体抽样时,统计学家建议采用概率抽样,因为基于概率抽样的样本可以对总体进行有效的统计推断。若...原创 2020-04-09 11:41:35 · 3252 阅读 · 0 评论 -
数据分析统计学原理第六章:连续型概率分布 | 我的统计学原理复习日记
离散型随机变量和连续型随机变量之间最根本的区别在于,二者在概率计算上是不同的。对一个离散型随机变量,概率函数f(x)给出了随机变量x取某个特定值的概率。而对连续型随机变量,与概率函数相对应的是概率密度函数( probability density function),也记作f(x).不同的是,概率密度函数并没有直接给出概率。但是,给定区间上曲线f(x)下的面积是连续型随机变量在该区间取值的概率。因...原创 2020-04-08 14:51:20 · 1509 阅读 · 0 评论 -
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记
随机变量(random variable):对试验结果的数值描述实际上,随机变量将每一个可能出现的试验结果赋予一个数值,随机变量的值取决于试验结果。随机变量根据取值可分为离散型或连续型。离散型随机变量(discrete random variable):随机变量为离散的连续型随机变量(continuous random variable):随机变量为某一区间或多个区间内的任意值对于离散...原创 2020-04-07 19:49:05 · 1232 阅读 · 0 评论 -
数据分析统计学原理第四章:概率基础 | 我的统计学原理复习日记
概率(probability):对事件发生的可能性的数值度量随机试验(random expriment):随机试验是一个过程,它所产生的试验结果是完全确定的,在每一次重复或者试验中,出现哪种结果完全由偶然性来决定样本空间(sample space):随机试验的样本空间是试验所有结果组成的一个集合掷色子的样本空间:样本点(sample point):一种特定的试验结果多步骤试验(mult...原创 2020-04-07 17:20:52 · 1003 阅读 · 0 评论 -
数据分析统计学原理第三章:数值方法 | 我的统计学原理复习日记
样本统计量(sample statistics):数据来自样本的计算的度量总体参数(population parameters):数据来自总体的计算的度量点估计量(point estimator):总体参数的样本统计量平均数(mean)样本平均数总体平均数平均数容易受极端值的影响加权平均数(weighted mean)例子:中位数(median):对变量中心位置的一种度量...原创 2020-04-07 15:42:43 · 1428 阅读 · 0 评论 -
数据分析统计学原理第一章:频数统计 | 我的统计学原理复习日记
频数分布(frequency distribution):在几个互不重叠的组别中,每一组项目的个数相对频数分布(relative frequency distribution)百分数频数分布(percent frequency distribution)条形图(bar chart)饼图(pie chart)对数量型数据的频数分布步骤:1. 确定互不重叠组的组数2. 确定每组的宽度...原创 2020-04-07 11:43:48 · 7121 阅读 · 0 评论 -
数据分析统计学原理第一章:基本概念 | 我的统计学原理复习日记
个体(element):搜集数据的实体变量(variable):个体中所感兴趣的特征测量值:每个个体的每一变量的值观测值(observation):某一个体得到的测量值集合名义尺度(nominal scale):无顺序无等级,比如:成员,非成员顺序尺度(ordinal scale):有顺序有等级意义,数据的间隔无意义,比如:A级,B级间隔尺度(interval scale):具有顺序数...原创 2020-04-07 10:06:55 · 1832 阅读 · 0 评论