![](https://img-blog.csdnimg.cn/20190927211852678.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
统计学
萝卜丝皮尔
统计学、管理科学与工程
展开
-
【统计学】Python计算并绘制样本数据的经验分布函数
参考文献:一篇绘制累积经验分布函数图像的博客如何得到样本数据的经验分布函数?from statsmodels.distributions.empirical_distribution import ECDFecdf = ECDF([3,3,1,4]) # 返回了一个分布函数,我是说数学书上的函数type(ecdf)Out[19]: statsmodels.distributions.empirical_distribution.ECDFecdf(3) # 往这个分布函数中输入自变量,会得到其分原创 2021-04-24 13:52:12 · 4501 阅读 · 0 评论 -
【回归分析】logistic regression for case-control data and conditional logistic regression
case-control study:对一群人分组,一组抽烟,一组不抽烟,再看有没有得肺癌,这要等很久,被称作cohort study;而case-control study是找一群有肺癌的人,问有没有抽烟,做分析。risk and odds ratio in case-control studyso far all deviations and analyses with logistic regression have assumed cohort sampling so that both原创 2020-12-10 14:38:40 · 684 阅读 · 0 评论 -
【回归分析】confounding effect 与 interaction
参考资料:b站的台湾公开课,搜索-黄冠华老师的【回归分析】没太注意中文是怎么翻译的,这两个概念在流行病学研究中似乎很重要。先看几个生活中的小例子,网上言论:“吃苹果的人都比较健康”,“爱发朋友圈的人寿命会比较长”,如何用统计学观点去解释?(其中有一个是曾经遇到的面试题)那么,我们能够下结论:苹果会保证健康么?不见得,因为吃苹果的人,普遍注意养生,所以他才健康。同样地,爱发朋友圈的人一般会比较开朗、乐观,而开朗乐观的人一般活得比较长,所以会有“爱发朋友圈的人活得比较长”。我记得我当时是按照相关关系≠因果原创 2020-12-10 10:14:44 · 2030 阅读 · 0 评论 -
【多元统计分析】课程总结
参考文献:《多元统计分析》高慧璇 编著 ,北京大学出版社刚考完,做个总结,意在搭个学习《多元统计分析》的简单架子,方便日后复习,虽然只学了一点皮毛,但是架不住老年人的脑子(“好记性,不如烂blog”)。其中,具体内容和公式不再一一陈述(据说,Latex是阻止人类文明进步的绊脚石。。)一句有用的废话:学习多元统计的时候,要多思考一元统计。一元统计里面正态分布是重中之重,这是因为后续的参数估计、假设检验等都是围绕它展开的,具体如:卡方分布、F分布、t分布等等。那么对应到多元中,多元正态分布也是核心,类似地原创 2020-11-11 17:28:38 · 6698 阅读 · 0 评论 -
【回归分析】logistic regresssion中的拟合优度检验(goodness-of-fit test)
参考资料:【回归分析】台湾交通大学-黄冠华教授goal : to test how well the used model fits to the observed data.in the linear regression,the coeffient of determination R2R^2R2, which represents the fraction of the total variation of the data explained by the used model, ca原创 2020-11-03 10:43:05 · 10026 阅读 · 0 评论 -
【统计学】面试笔记
参考教材:《概率论与数理统计》峁诗松什么是频率稳定于概率?频率依概率收敛于概率。随着n的增大,事件A发生的频率Snn\frac{S_n}{n}nSn与概率p的偏差∣Snn−p∣|\frac{S_n}{n}-p|∣nSn−p∣大于预先给定精度ϵ\epsilonϵ的可能性愈来愈小,要多小有多小。蒙特卡罗方法计算定积分的方法随机投点法:依据是 伯努利大数定律;平均值法: 使用了辛钦大数定律;大数定律大数定律讨论的是 在什么条件下,随机变量序列的算术平均 依概率收敛于 其均值的算术平均;原创 2020-10-12 16:09:03 · 1371 阅读 · 2 评论 -
统计期刊阅读笔记
2020.6.6“提升编程能力在数据科学领域占有一席之地 "作者:阮敬(首都经济贸易大学)期刊:《中国统计》这个期刊影响因子并不很强,大概是零点几吧;相比于《统计研究》(影响因子比较高),内容更为通俗易懂,《统计研究》的文章还真是不是我这类文盲有兴趣就能够拜读的……《中国统计》刊登了好几篇作者阮敬教授的文章,在这篇文章中,作者提到有关一开始的面向过程的编程语言特点,是一种科学思维每一步就是一个过程,过程之间有很强的连续性、逻辑性……然后又引用了一句恩格斯的哲学文章中的一句话----“必须先研究十五原创 2020-06-08 18:56:54 · 719 阅读 · 0 评论 -
【计量经济学】--经典线性回归
计量经济学的组成:经济理论+数学+统计推断;计量经济学:实际经济现象的定量分析,利用数理统计分析经济数据,对于构建于数理经济学基础上的数学模型提供经验支持,并得出数量结果;因变量,被解释变量explained variable;自变量,解释变量explainatory variable;...原创 2020-02-17 18:19:14 · 3240 阅读 · 0 评论 -
《女士品茶》读书笔记
书的名字来源于统计学史上著名事件,也就是假设检验的原型:费希尔对一位声称自己能够分清午茶是先加奶还是先加茶。书的主要内容不是统计学的各种公式,而是各种公式、定理的来由,以及其发现者的故事。简单地,做一下今天所看内容的笔记:卡尔·皮尔逊,19世纪90年代,英国皇家统计协会的成员,在当时的统计学界很有威望,出身居然不是理学,而是政治学 。读完硕士之后,迷上马克思,而他后来差不多是倾向共产主...原创 2020-01-25 17:31:49 · 2279 阅读 · 0 评论 -
数学专业课程《实变函数论》学习总结
我觉得我们学院的老师不是在给我们传授各种数学知识,而是在告诉我们一个道理:你的能量超乎你想象……何出此言?自打入院以来,别人学“高等数学”,我们学“数学分析”;别人学“线性代数”,我们学“高等代数”,然后,解析几何,常微分方程(英文教学),矩阵计算(又称数值线性代数,双语教学),概率论与数理统计(峁诗松老师的教材,老厚一本),数值分析,等等未完待续吧我以为我再也学不会《数学分析》了,直到遇...原创 2020-01-07 11:10:05 · 9009 阅读 · 1 评论 -
《统计之美》读书笔记
实践与理论 如果说峁诗松的《数理统计与概率论》是统计学的理论概括的话,这本书应该就是统计学的实践介绍。这本书结合了当今时代下人工智能思想,介绍了统计在各行各业的应用。 从序言中能看出这本书意在向广大读者推广统计学的知识,在书的每一小节都以一个相关知识点的小故事开题,再引入统计学专业知识,但是,我并不觉得这是本很好的统计学的科普读物,里面有些公式还是需要点数学和统计底子的。反...原创 2020-01-06 20:52:40 · 846 阅读 · 0 评论 -
《抽样技术》期末复习
抽样的分类:非概率抽样和概率抽样。非概率抽样:抽取样本时不依据随机原则。举例:判断抽样,方便抽样,自愿抽样,配额抽样。方便抽样,也称随意抽样,并不是随机抽样。优点:操作简单,不需要抽样框,经济、快速,调查数据处理也容易。缺点:不能计算抽样误差,不能从概率意义上控制误差,样本数据不能对总体进行推断,被调查单元存在系统性误差。概率抽样:也称随机抽样,依据随机原则,按照事先设计好的程序...原创 2020-01-05 11:47:39 · 1626 阅读 · 0 评论 -
统计学---一元线性回归
预测之后的相关估计:点估计:在点估计的条件下,平均值 的点估计和个别值的点估计是一样的。但在区间估计不同。区间估计:点估计值与实际值之间是有误差的,因此需要进行区间估计。对于自变量X0,根据回归方程得到因变量y的一个估计区间。区间估计分为:置信区间估计和预测区间估计。置信区间估计:对于自变量x的一个给定值x0,求出因变量y的平均值的估计区间。预测区间估计:对于给定自变量x的一个...原创 2019-10-27 15:00:14 · 3503 阅读 · 0 评论 -
统计学---数据的误差
数据的误差分为两类:1.抽样误差是一种随机性误差;引起:抽样的随机性;只出现在概率抽样中;只要采用概率抽样,抽样误差就是不可避免的;抽样误差是可计算的;抽样误差是可控制的,主要通过改变样本量来控制;2.非抽样误差出现在概率抽样、非概率抽样、全面调查中;分为:抽样框误差只出现在概率抽样中(因为只有概率抽样需要抽样框)。回答误差主要有理解误差、记忆误差、有意识误差。记忆...原创 2019-10-21 16:15:24 · 8620 阅读 · 0 评论 -
统计学--变量、数据、抽样
变量值是变量的取值变量的类型1.1 分类变量1.2 顺序变量1.3 数值型变量另,根据其取值不同又可分为:离散型变量、连续型变量数据处理:将数据用图表等形式展现出来;数据分析:选择适当的统计方法研究数据,并从数据中提取有用信息进而得出结论,具体方法有描述统计和推断统计。推断统计:如何利用样本数据来推断总体特征的统计方法。截面数据时间序列数据统...原创 2019-10-20 10:02:03 · 2044 阅读 · 0 评论 -
统计学---方差分析
单因素方差分析:问题:行业不同是否影响被投诉次数?表格说明:零售业对应列的7个数据是七个不同(零售业的)公司各自的被投诉次数,其他行业及其数据类似。使用Excel进行单方差分析首先在Excel中添加加载项【数据分析】。【数据】选项卡,【分析】,【数据分析】对话框,选择“方差分析:单因素方差分析”,在对话框设置中依次选择数据区域、第一行是否有标志、α值等,【确定】。结果展示如下:...原创 2019-09-27 20:38:29 · 3542 阅读 · 0 评论 -
统计学里的小故事
最近在看John.A.Rice的《数理统计与数据分析》,随手记下一点点笔记。1.辛普森悖论简述:一个反直觉的结论。要求:尽可能抽出红球。情况1:黑色盒子白色盒子5个红球3个红球6个绿球4个绿球那么,在黑色盒子中,抽到红球的概率为5/11=0.455,在白色盒子中,抽到红球的概率为3/7=0.429结论:从黑色盒子中抽取。情况2:黑色盒...原创 2019-09-07 18:09:21 · 2612 阅读 · 0 评论