统计基本方法
文章平均质量分 70
一些统计基本方法,列联分析、相关分析、方差分析、线性回归、假设检验等
老身聊发少年狂
这个作者很懒,什么都没留下…
展开
-
序列的趋势存在性检验:Cox-Stuart test和Mann-Kendall test
我们经常听这样的描述,数据呈现上升/下降/无明显趋势,这个结论大都是靠人眼观察出来的,往往不够严谨。我们需要更科学的方法,下面就借助非参里的符号检验,来谈谈检验趋势存在性的两种常用方法。Cox-Stuart趋势检验原理对于数据序列x1,x2,x3,……,xn,我们以位置中间数c为界把该序列分成两部分,并两两配对成(x1,xc+1),(x2,xc+2),……(xc,xn)的形式。接着我们以每一组中后一个数减去前一个数并记下正负性,s+表示得到正数的个数,s-表示得到负数的个数。如果s+远远大于s原创 2020-05-31 17:42:31 · 7597 阅读 · 4 评论 -
常见数字规律:帕累托定律与本福特定律
帕累托定律:又名二八定律,揭示了一类常见的投入-产出不平衡的现象,认为80%的产出实际上是由20%的最top的投入决定的。这个定律应用非常广泛,比如,最有少部分大客户,贡献了大部分的销售额;财富分析发现,巨量的财富掌握在少数人的手中。以之前的订单数据为例,从商品和用户对销售额的贡献两个角度,进行帕累托分析:红色虚线标记了理论上20%-80%,实际上有出入。从商品帕累托图来看,商品的价...原创 2020-03-07 16:20:30 · 1979 阅读 · 0 评论 -
R-7.假设检验与轮廓分析
假设检验就是在根据样本信息和抽样分布对总体参数进行推断,通常用的就是两种:均值检验和方差检验,按检验方法可分为:参数检验与非参数检验。1、 参数检验T检验 U检验 F检验 卡方检验(分布检验)参考:R语言各种假设检验实例整理(常用) - ywliao - 博客园https://www.cnblogs.com/ywliao/p/6724334.html【数据分析 R语言实战】学习笔记 第七...原创 2020-01-27 16:43:33 · 1153 阅读 · 0 评论 -
R-5.多元线性回归
在相关关系一文中,我们探讨了俩数值型变量的相关问题,相关系数可反映相关性大小和方向,相关性检验可证明相关系数的可靠性。但是,研究变量间的关系仅靠相关分析是不够的,为了获得更精确的数量关系以及做一些基本的推断,有必要引入线性回归模型,对这种数量关系做进一步的刻画。1、线性回归简介...原创 2020-01-20 21:28:27 · 692 阅读 · 0 评论 -
R-4.方差分析
项目背景,现有个xx条订单数据,来自xx个省的买家,现要分析,不同地区的买家的购物行为(比如订单金额)是否存在显著差异。有人觉得很简单啊,把各省分类汇总求个均值求个和就行,明显错误。比如A组:2,10, 100;B组56,56,;C组:20,26,22,24,这三组均值、和没有差别,但能说三组等价吗?方差分析同时考虑了组内方差与组间方差,在各组独立、正态、同方差的假设前提下,检验均值齐性,显然...原创 2020-01-09 21:10:11 · 597 阅读 · 0 评论 -
R-3.相关分析(数值型变量)
这篇文章的相关分析主要涉及的是数值型变量,分析方法包括相关系数的计算、相关关系的检验以及相关系数的可视化,从两变量说起,延伸到多变量。原创 2020-01-07 12:20:03 · 1938 阅读 · 0 评论 -
R-2.列联分析(分类数据的关联分析)
参考《非参数统计》王星第六章:分类数据的关联分析原创 2020-01-18 12:37:36 · 3575 阅读 · 0 评论 -
R-1.统计基本方法概述
接下来几篇文章将涉及列联分析、相关分析、方差分析、线性回归、假设检验等内容。这些都是统计中最基础的,也是现实中比较实用的,但在毕业后很容易被无视的统计方法。统计建模通俗意义上就是在探寻数据背后的事物的“相关性”,以上提到的方法中:列联分析用来检验两个分类变量的独立性,eg:吸烟与肺癌相关分析常用来研究两个数值型变量间的相关关系,eg:消费-收入方差分析用于探索分类变量对...原创 2020-01-07 12:25:48 · 259 阅读 · 0 评论