自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

原创 Python递归算法求解汉诺塔问题

问题描述据说古代有一个梵塔,塔内有三个底座A、B、C,A座上有64个盘子,盘子大小不等,大的在下,小的在上。有一个和尚想把这64个盘子从A座移到C座,但每次只能允许移动一个盘子。在移动盘子的过程中可以利用B座,但任何时刻3个座上的盘子都必须始终保持大盘在下、小盘在上的顺序。如果只有一个盘子,则不需要利用B座,直接将盘子从A移动到C即可。和尚想知道这项任务的详细移动步骤和顺序。根据数学知识我们可以知道,移动n个盘子需要2^n-1步,64个盘子需要18446744073709551615步。如果每步需要一秒

2020-06-29 15:21:02 2335

原创 各类排序法的Python实现

各类排序法的Python实现冒泡法def bubbleSort(lst): length = len(lst) for i in range(0, length): for j in range(0, length-i-1): #比较相邻两个元素大小,并根据需要进行交换 if lst[j] > lst[j+1]: lst[j], lst[j+1] = lst[j+1], lst[j]

2020-06-29 15:16:15 444

原创 Python玩转数据分析——相关分析

Pearson 相关检验在参数统计中,常用的相关分析方法是 Pearson 相关系数,公式如下:r(X,Y)=∑i[(Xi−Xˉ)(Yi−Yˉ)]∑i(Xi−Xˉ)2∑i(Yi−Yˉ)2r(\bm{X,Y})=\frac{\sum^{}_{i}[(X_i-\bar{X})(Y_i-\bar{Y})]}{\sqrt{\sum^{}_{i}(X_i-\bar{X})^2\sum^{}_{i}...

2019-12-05 17:13:19 728

原创 非参数统计的Python实现—— Mantel-Haenszel 检验

概念很多研究都涉及分层数据结构,比如产品研究中需要根据城市和农村特点分别研究不同人群对产品的满意程度,这里城市和农村是问题的两个层,层中不同人群对产品的满意程度可以用列联表表示。回答处理与反应结果是否独立的问题时,需要首先按层计算差异,再将各层的差异进行综合比较,从而做出综合的判断。在本文中笔者仅考虑各层 2*2 的列联表处理,且试验组的阳性结果放在列联表第一行第一列位置。实例 & 代...

2019-12-02 22:01:56 3614

原创 非参数统计的Python实现—— Fisher 精确性检验

概念Pearson 卡方检验要求二维列联表只允许 20% 以下格子的期望数小于5,对于 2×2 列联表,应当用 Fisher 精确检验法。实例 & 代码以下是 A 和 B 两种药物的二维列联表数据,问 A 和 B 两种药物的治疗效果是否相同?显著性水平为0.05。疗效有效无效A82B723解答:scipy.stats.fisher_exa...

2019-10-06 21:02:15 7754

原创 非参数统计的Python实现—— Durbin 不完全区组分析法

概念当处理组非常大,而区组中可允许样本量有限时,在一个区组中很难包含所有处理。于是出现了不完全的数据设计结构,其中较为常见的是均衡不完全区组 BIB 设计。Durbin 检验能用于不完全区组设计中。均衡不完全区组需满足以下条件:每个区组包含 t 个水平——区组大小相等;每个处理在 r 个区组中出现——处理重复数相等;每对处理在 λ 个区组中相遇——相遇数相等。实例 & 代码...

2019-10-03 15:38:41 1665

原创 非参数统计的Python实现—— Cochran 检验

概念一个完全区组设计的特殊情况是观测值只取“是”或“否”、“同意”或“不同意”、“1”或“0”等二元定性数据。这时,由于有太多的重复数据,秩方法的应用得到限制,就要用到 Cochran 检验法来测量多处理二元数据之间的差异是否存在。实例 & 代码设有 A,B,C 三种榨汁机分给10位家庭主妇使用,用以比较三种榨汁机受喜爱程度是否相同。对于喜欢的品牌给1分,否则给0分,调查结果如下表所...

2019-10-03 12:50:19 2569

原创 非参数统计的Python实现—— HL 检验

概念调整秩和检验 ( aligned ranks test ) ,也称为 Hodges-Lehmmann 检验,简记为 HL 检验。当随机完全区组设计的区组数较大或处理组数较小是,Friedman 检验的效果就不是很好了,因为 Friedman 检验的编秩是在每一个区组内进行的,这种编秩的方法仅限于区组内的效应,所以不同区组间相应的直接比较是无意义的( Friedman 检验具体应用方法见笔者...

2019-09-30 17:01:01 5548 1

原创 非参数统计的Python实现—— Friedman 秩方差分析

概念像 Kruskal-Wallis 检验那样的分析方法是针对完全随机试验数据的( Kruskal-Wallis 检验方法详见https://blog.csdn.net/Raider_zreo/article/details/101694851),而当各处理的样本重复数据存在区组之间的差异时,必须考虑区组对结果的影响。对于随机区组的数据,传统的方差分析要求试验误差是正态分布的,当数据不符合方差分...

2019-09-29 23:31:06 6234 2

原创 非参数统计的Python实现—— Kruskal-Wallis 单因素方差分析

概念Kruskal-Wallis 单因素方差分析是一个将两样本的 W-M-W 检验推广到三个或更多组检验的方法。W-M-W 检验方法具体可以看笔者另一篇博客https://blog.csdn.net/Raider_zreo/article/details/101673853,而Kruskal-Wallis 单因素方差分析方法是类似的:先把多个完全随机设计的样本混合起来求秩,再按样本组求秩和,考虑...

2019-09-29 16:02:19 13083

原创 非参数统计的Python实现—— Mann-Whitney 秩和检验

概念Mann-Whitney 秩和检验,也被称为 Mann-Whitney-U 检验。在笔者另一篇博客 ( https://blog.csdn.net/Raider_zreo/article/details/101380293 ) 中已经对 Wilcoxon 秩和检验有过介绍,事实上,Wilcoxon 统计量与 Mann-Whitney 统计量是等价的。Wilcoxon 秩和检验主要针对两样本量...

2019-09-29 11:07:05 19381 10

原创 尺度参数检验的Python实现(汇总)

尺度参数概念描述总体分布离散程度的参数为尺度参数 ( scale parameter ) ,与其相对应的,描述总体分布集中趋势的参数为位置参数 ( location parameter ) 。levene 检验对多个样本的方差齐性检验,属于参数检验(本质是F检验)。此方法不用考虑样本总体的分布,因此比较稳健。scipy.stats.levene ( sample1, sample2, …...

2019-09-26 18:12:21 2080

原创 非参数统计的Python实现——卡方独立性检验

概念研究变量与变量之间是否有关联的检验方法,H0 :两变量独立。案例 & 代码为研究血型与肝病之间的关系,对295名肝病患者及638名非肝病患者(对照组)调查不同血型的得病情况,如下表所示,问血型与肝病之前是否存在关联?显著性水平为0.05。血型肝炎肝硬化对照O9838289A6741262B13857AB18123...

2019-09-25 21:18:47 2417

原创 非参数统计的Python实现—— Wilcoxon 符号秩检验

概念Wilcoxon 符号秩检验的检验目的和符号检验是一样的,但 Wilcoxon 符号秩检验需要假设样本点来自连续对称总体分布,在这个假设下总体的对称中心是总体中位数之一。Wilcoxon 符号秩检验就是要检验双边问题 H0 :M = M0 或检验单边问题 H0 :M ≤ M0 及 H0 :M ≥ M0 。实例 & 代码为了解垃圾邮件对大型公司决策层的工作影响程度,某网站收集了19...

2019-09-25 19:38:05 19652 1

原创 非参数统计的Python实现——随机游程检验

概念随机游程检验是检验一个序列中的数据出现是否与顺序无关的一种方法。值得注意的是,随机游程检验的零假设是数据出现顺序随机,备择假设是数据出现顺序不随机。实例 & 代码在试验设计中,经常要关心试验误差 ( experiment error ) 是否与序号无关。假设有 A, B, C 三个葡萄品种,用完全试验设计需要重复测量4次,安排在12个试验田中栽种,共得到12组数据,每个试验田试验...

2019-09-23 16:09:43 4064

原创 非参数统计的Python实现—— Cox-Staut 趋势存在性检验

概念Cox-Staut 趋势存在性检验是一种不依赖于趋势结构(如线性趋势)的快速判断趋势是否存在的方法。实例 & 代码现有某地区32年来的降雨量数据(单位:mm),为[ 206 , 223 , 235 , 264 , 229 , 217 , 188 , 204 , 182 , 230 , 223 , 227 , 242 , 238 , 207 , 208 , 216 , 233 , ...

2019-09-22 19:13:03 3593 1

原创 非参数统计的Python实现——符号检验

概念符号检验 ( sign test ) 是非参数统计中最古老的检验方法之一,仅通过符号 “+” 和 “-” 的个数来检验分位数。实例 & 代码现有28位学生某门课程的成绩数据,为[ 95 , 89 , 68 , 90 , 88 , 60 , 81 , 67 , 60 , 60 , 60 , 63 , 60 , 92 , 60 , 88 , 88 , 87 , 60 , 73 , 6...

2019-09-22 17:57:59 4220

原创 Python玩转数据分析——T检验

概念T检验,也称 student t 检验 ( Student’s t test ) ,用来比较两个样本的均值差异是否显著,通常用于样本含量较小 ( n < 30 ) 的样本。分为单样本 t 检验、两独立样本 t 检验和两配对样本 t 检验。适用条件已知一个总体均数;可得到一个样本均数及该样本标准差;样本来自正态或近似正态总体。单样本 t 检验假设现在有10个男生的体重数据...

2019-09-20 20:15:38 4380

原创 Python玩转数据分析——双因素方差分析

概念方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。双因素方差分析即影响试验的因素有两个,且分为无交互作用和有交互作用两种情况。一、无交互作用的情况由于不考虑交互作用的影响,对每一个因素组合 ( Ai , Bj ) 只需进行一次独立试验,称为无重复试验。准备数据考虑三种不同形式的广告和五种不...

2019-09-19 22:21:10 6888 2

原创 Python玩转数据分析——单因素方差分析

概念方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。单因素方差分析即影响试验的因素只有一个。需要满足的假设样本是独立的。每个样本来自正态分布的总体。各总体的标准偏差都是相等的,即同方差性。准备数据将抗生素注入人体会产生抗生素与血浆蛋白质结合的现象,这种结合会降低药效。下表给出了四种常...

2019-09-19 20:36:48 4545 4

原创 Python玩转数据分析——数据处理之数据清洗(处理缺失值)

数据分析总流程明确调查目的明确分析思路数据准备数据处理数据分析数据可视化生成报告数据处理流程数据清洗数据加工数据抽样数据清洗流程处理重复数据处理缺失值处理逻辑错误处理缺失值方法方法一:用一个样本统计量的值代替缺失值,通常用样本平均值和中位数。方法二:用一个统计模型计算的值代替缺失值,通常用回归模型、判别模型等。方法三:将有缺失值的记录删除。这里仅展示方法一的Python实...

2019-09-16 11:14:02 1014

原创 Python玩转数据分析——数据处理之数据清洗(处理重复数据)

数据分析总流程明确调查目的明确分析思路数据准备数据处理数据分析数据可视化生成报告数据处理流程数据清洗数据加工数据抽样数据清洗流程处理重复数据处理缺失值处理逻辑错误处理重复数据准备数据假设现在有一个货物表,为方便处理,只显示其编码,数据如下:编号A667708A310882A356317A520304A776477A466074...

2019-09-15 17:47:54 1919

原创 Python玩转数据分析——数据准备(导入数据)

数据分析总流程明确调查目的明确分析思路数据准备数据处理数据分析数据可视化生成报告导入数据import pandas as pd导入Excel数据pd.read_excel(filepath, sheetname=0, header=0, skiprows=None, skip_footer=None, index_col=None, names=None)filepath:Ex...

2019-09-15 12:11:44 629

原创 Python玩转数据分析——数据准备(二维表转换一维表)

准备数据假设现在有一个时空二维表,表示北京、上海、山东、广东分别在2006年、2007年和2008年的年GDP,数据如下:地区200620072008北京7861935310488上海103661218913698山东220772596631720广东261603108435696用Python导入数据import pa...

2019-09-09 18:55:54 949

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除