![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
统计
进击的可乐!
公众号【可乐的数据分析之路】。出版书《Excel数据处理与分析——数据思维+分析方法+场景应用》
展开
-
离散型随机变量的概率分布
这一小节我们一起学习几个离散型随机变量里的特殊的概率分布:几何分布、二项分布和泊松分布。几何分布乘风破浪的姐姐最近正在热播,还记得万茜小姐姐第一次个人solo的那段吉他弹唱吗?第一次她在台上弹错了,第二次虽然也有失误,但算是完整地弹了下来,假定她没有失误完成弹唱的概率是0.2,可以彩排两次,试一次或者两次就能成功的概率是多大?(如果第一次直接成功,则不进行第二次)这是个概率的问题,还记得上一小节的内容吗?可以画个图来理解下这个问题。已知:P(X=1) =P(第一次成功) = 0.2即第一次原创 2020-12-16 16:51:59 · 4372 阅读 · 0 评论 -
天猫双十一成交额是如何预测的
2020年淘宝双十一成交额4982亿,要知道2019年是2684亿,猛地一瞅,好牛,但总量越来越大的同时增长率却逐年降低呀,且今年的统计口径和历年都不一样(后面会说统计口径的问题)。其实早在2019年双十一前,网友们就开始讨论双十一数据造假的问题了,有网友对历年数据进行拟合并且成功预测19年的成交额,结果都高度吻合。今天我们主要是借着双十一成交额这个数据来聊一聊时间序列分析的问题时间序列,顾名思义,就是数据随时间变化时间序列进行预测的关键,是确定已有时间序列的变化模式,并假定这种模式会延续到未来原创 2020-12-15 22:36:09 · 1532 阅读 · 0 评论 -
2020年出生人口会大跌吗?解读人口数据
2020年马上就要过去了,今年的人口普查是一个大事,在2019年官方公布的出生人口为1465万的前提下,大家也尤为关注2020年的出生人口,这篇文章就来讲解一下有关人口的各种数据。第一部分:人口数据首先我先了解了一下我国历年来的人口数据,从国家统计局(http://www.stats.gov.cn)公布的数据上可以看到1949年以来至2019年的人口出生率、死亡率和自然增长率(出生人口可以用总人口与出生率相乘得到)。欲看懂这个图,得先知道以下几个概念:人口普查:要说明一下1982、1990、2.原创 2020-12-14 22:22:53 · 17585 阅读 · 2 评论 -
强势回归,说说线性回归
高尔顿发现了“向平均回归”,一个总体中在某一时期具有某一极端特征的个体在未来的某一时期将减弱它的极端性,比如非常矮小的父辈倾向于有偏高的子代,而非常高大的父辈则倾向于有偏矮的子代。这些都是“回归效应”变量间的度量对于数值型自变量和数值型因变量之间的分析方法就要用到相关与回归分析。变量间的关系有两种:函数关系和相关关系。函数关系函数关系是一一对应的确定关系,因变量y随自变量x的变化而变化,比如销售额和销量之间的关系,就是线性函数关系。相关关系但是很多时候变量之间的关系是不确定的,这种不确定的数量关原创 2020-12-12 12:02:37 · 1842 阅读 · 0 评论 -
据说假设检验是个很难的题
假设检验是利用样本对总体进行的推断。其原理是小概率反证法。即为了检验一个假设是否成立,我们先假设它成立,在原假设成立的前提下,如果出现了不合理的事件,则说明样本与总体的差异是显著的,就拒绝原假设,如果没有出现不合理的事件,就不拒绝原假设。这里所述的不合理的事件指的是小概率事件,通常情况下我们认为一个小概率事件基本上不会发生,如果发生了,说明它就不是一个小概率事件了,所以不能接受原假设。假设检验的基本问题Q:1989年某地新生儿的平均体重为3190克,1990年新生儿随机抽取100个平均体重为3210克原创 2020-11-30 21:46:39 · 1045 阅读 · 0 评论 -
18个常见的数据分析面试题-概率统计类
总结了一些常见的概率与统计类的数据分析面试题,不定期更新……随机变量的含义一个随机事件的所有可能的值X,且每个可能值X都有确定的概率P,X就是P(X)的随机变量。比如掷骰子中出现的点数随机变量和随机试验间有什么关系随机试验:相同条件下对某随机现象进行的大量重复观测的试验,如掷硬币100次统计正面朝上的次数 随机变量是用来描述随机试验结果的。划分连续型随机变量和离散型随机变量的依据离散型随机变量:随机变量X能被一一列举出来,如一批产品中次品的数量,某地区人口的出生数等。原创 2020-11-17 06:07:32 · 3541 阅读 · 2 评论 -
深入浅出统计学读后感
哈喽,大家好,我是可乐今天给大家推荐这本《深入浅出统计学》,文末有我总结的知识图谱。《深入浅出统计学》这本书我看了好几遍,一直没法下笔写它的总结,因为感觉还没有征服它,每次感觉懂了的时候,总会遇到不明白的地方,不过我还是鼓起勇气来写这篇读书笔记,目的是向大家推荐这本神书,值得反复咀嚼。建议同时结合贾俊平老师的《统计学》这本书一起食用,效果会更佳哦。第一部分:数据的度量第一节 信息图形化 的内容是讲作图的,数据总归要化繁为简,进行可视化的,我在如何进行数据图形化这篇文章..原创 2020-11-15 21:22:28 · 742 阅读 · 0 评论 -
连续性变量的概率分布
前一篇文章写的是离散型随机变量的概率分布,今天我们来聊聊连续型随机变量的概率分布。并非所有的数据都是连续的,根据数据类型的不同,有不同的求概率的方法,对于离散型随机变量的概率分布,我们关心的是取某一个特定数值下的概率,而对于连续型随机变量的概率分布,我们关心的是取某一个特定范围内的概率。首先要提到的一个概念就是:概率密度函数概率密度函数用来描述连续型随机变量的概率分布,用函数f(x)表示连续型随机变量,将f(x)就称为概率密度函数,概率密度并非概率,只是一种表示概率的方法,大家不要混淆,其曲原创 2020-11-07 10:47:23 · 3706 阅读 · 1 评论 -
你真的了解概率吗?
概率和统计学的关系十分密切,大量统计学的知识都起源于概率论,概率论与数理统计也是工科必修的科目之一,现在我们来把它浓缩成一篇文章,当然如果想要更深入地学习,还是建议大家自己看书哟。概率的本质是什么?我们都知道扔一枚硬币,正面朝上的概率为0.5,那0.5是什么意思呢?对概率的解释有两大学派,主观概率派和客观概率派,由两种解释建立起了贝叶斯统计学和传统数理统计学(频率论学派)。客观概率派客观概率派中对概率的解释是基于物理世界本身存在的随机性,客观概率派中的频率派,即将频率作为概率,也就是说要原创 2020-08-27 18:48:58 · 213 阅读 · 0 评论