统计学
数据小斑马
浙大硕士毕业,互联网数据分析师,喜欢深入业务,也喜欢挖掘技术,希望和大家可以多多交流
展开
-
统计学①——概率论基础及业务实战
一、统计学是什么?统计学分为两类,一类是描述性统计学,通过对数据的集中趋势和变异趋势的刻画来描述数据的分布情况,集中趋势有平均值,中位数和众数三个指标,变异趋势则有全距,四分位距,百分位距,方差,标准差等指标来衡量另一类是推断统计学,通过对样本的统计来推断总体的参数和置信区间,以及对多变量进行相关性分析和回归预测。用一句话就是:总结历史,预测未来二、概率论基础概率论是统计学中非常重要且基...原创 2019-07-15 21:35:30 · 1752 阅读 · 1 评论 -
统计学④——置信区间怎么算
上一篇写了如何通过样本的均值和方差,也叫点估计量,去估计总体的均值和方差,给出的是一个精确值。但是仅仅依靠一个样本得出的假设就一定可靠吗?虽然我们已经尽量抽取无偏样本了,得到的结果已经是最佳的点估计量,但是也只能说很接近总体的真值,但是有多接近也不知道。因此,在给总体估计参数时,不是给一个精确值,而是一个范围,而且能保证总体参数有多大把握在这个范围,会比给一个精确值能令人信服的多,风险性也较小,...原创 2019-07-18 09:14:10 · 43879 阅读 · 0 评论 -
统计学②——概率分布(几何,二项,泊松,正态分布)
概率分布描述了一个给定变量的所有可能取值结果的概率,像上篇博文总结到,根据概率分布计算期望和方差如下:在X取值较小时这样还能算得出来,但是X取值非常多时,甚至取之不尽时(比如可以取1-正无穷),那这样该如何计算期望和方差呢?当然这难不倒我们历史上伟大的数学家们,他们经过大量实验发现了一些很特殊的概率分布,比如几何,二项,泊松,正太分布等,而这些期望和方差都有特定的方法,可是给我们节约了不少时...原创 2019-07-16 21:29:27 · 5876 阅读 · 0 评论 -
统计学③——总体与样本的差异在哪里
一、总体与样本定义总体:所研究的所有事件的集合样本:是从总体中抽出的数量相对较小的集合,可用于做出对总体的结论二、抽样方法我们希望抽取的样本分布和总体分布一致,这样用样本估计总体会比较准确,这种样本叫作无偏样本。无偏样本的抽样方法:① 简单随机抽样:抽签,随机编号生成器,有放回抽样和不放回两种② 分层抽样:将总体分为几个层,层内部相似,层与层之间差距较大,再对每一层进行简单随机抽样...原创 2019-07-16 22:42:13 · 9624 阅读 · 0 评论 -
统计学⑤——假设验证
一、什么是假设验证?当你从广告中,从别人口中,从新闻上等得到一个结论时,你要判断这个结论是否可信,假设验证就是这样一种判断是否值得可信的方法。比如市面上很繁荣的IT培训,包你在三个月找到工作,这怎么验证真伪呢?先假设这句话是真的,再去选择一些参加过培训的人的,看找到工作的人有多少?如果都找到了那就值得信,但是由于各种各样的因素不太可能谁都找到,我们允许有一定的误差,假如5%,那就超过95%的都...原创 2019-07-21 09:03:22 · 3468 阅读 · 0 评论