新版白话空间统计
文章平均质量分 85
虾神说D
攻城狮
展开
-
新版白话空间统计(25):方向分布(标准差椭圆)
方向分布是虾神最喜欢的一个空间统计工具,也是最简单明了,但是用处很广的一个点模式的分析中,一般会考察如下五种内容:1、点的疏密,包括点数据的分布探索,是否一致、均匀或者不均匀。2、点的方位,包括点的分布和方向。3、点的数量:多少(极值和均值)。4、点的大小:代表的含义(如点一个点代表多少人口)。5、其他,如点的一些动态变化等。我们前面说的好几种算法,如中心要素、中位数中心和平均中心,都是关于点方位的分析,那么今天我们要讲的这个算法,就是同时对点的方向和分布进行分析的一种经典算法——标准差椭圆。这算法最早是由原创 2022-06-14 16:45:22 · 4387 阅读 · 2 评论 -
新版白话空间统计(24):中位数中心
前文再续,书接上一回。(今天是个4300多字的大章,没时间的同学,看图就行)平均数和中位数的PK也不是一两天了。我们经常在新闻上看见统计部门发布的各种平均数,看完之后,大家的反应估计都和虾神差不多:所有,不断有产学研三界的专家呼吁,为什么我们不用中位数,按道理来说,中位数更能反映真实情况:比如就是美国在国民统计中就使用了中位数。当然,美国曾经也仅运用平均数来统计来统计的,但是近几十年则越来越多地使用中位数统计。如上图所示,这是2016年美国人口普查局公布的全美家庭收入统计原创 2022-04-12 14:16:28 · 2192 阅读 · 0 评论 -
新版白话空间统计(23):平均中心
上一篇讲了中心要素,因为中心要素是要从原来的要素中去选择一个已有的,所以算出来的,与我们观念和感知中的“中心”这个概念,还是差距很大,所以今天来平均中心和后面要说的中位数中心这两种比较符合我们观感的中心,以及这两种中心的计算方式和应用范围。我们先来看看三者之间的不同,如下图:可以看到,计算出来的结果各有不同,首先中心要素我们就不说了,大家有兴趣可以去看看上一篇文章,然后今天要说的算数平均中心,也不是一样的,那么他们分别代表什么样的含义呢?首先,看看最符合我们感知的整份数据的中心位置是哪个?毋原创 2022-03-02 09:23:08 · 1100 阅读 · 0 评论 -
新版白话空间统计(22):中心要素
CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D转发、转载和爬虫,请主动保留此声明。美国著名统计学家,统计学史专家,芝加哥大学统计学院教授Stephen M. Stigler(斯蒂芬.斯蒂格勒)出过一本影响深远的著作:《统计学七支柱》,对统计学历史上里程碑式的几种统计思想的历史来源的回溯,记录的是数百年来这些思想萌芽和发展的若干瞬间。有些思想的发展或许并不瞩目,但源远流长。何为支柱?支柱的概念就是一旦出问题,整个体系就会轰然崩塌。在Stigler教授的著作中,把统计学七支柱描述为:原创 2021-11-10 17:39:04 · 1911 阅读 · 0 评论 -
新版白话空间统计(21)平均最近邻
前面的章节里面,我们看了很多关于空间分布模式的基本原理,从这一章节开始,我们讲一些具体的工具和算法的使用。前面我们用莫兰指数、P值、Z得分啥的,可以得出一份数据是属于离散、随机还是聚集,并且通过各种指数,得出聚集或者离散的程度,这种指数就是我们在定量分析时候经常用手段之一。像莫兰指数这样的分析,在关注空间关系的同时,还要考虑属性,也就是并非单纯的在考虑空间上的聚集。而上篇文章我们说到,点数据分析里面,很多分析,并不需要(或者没有)数值型的属性,而仅仅考虑从空间位置上做分析。比如:纯粹的空间位置的数据原创 2021-09-26 11:53:45 · 5464 阅读 · 1 评论 -
新版白话空间统计(20)空间关系概念化之点临近
写在最前面:上篇文章说了在GeoDa里面去自定义空间权重关系,有的同学问,在ArcGIS里面怎么做呢?我做过一个小视频,需要的同学在虾神的公众号里面发送“空间权重矩阵”六个字,就可以获得了。前面的文章说到,在分析的数据里面,分布是这个样子的:在所有数据里面,点数据是最容易获取到的,都不需要专业的软件,一个文本就可以制作,而点数据的获取,只要能上网就能从各种互联网地图上获取到,比如X度地图坐标拾取系统:而只要有坐标,就可以轻而易举的变成空间数据,比如下面这份我用了无数次的北京市三级及以原创 2021-08-19 12:10:11 · 1267 阅读 · 2 评论 -
新版白话空间统计(19)空间关系对莫兰指数的影响
CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D转发、转载和爬虫,请主动保留此声明。前文再续,书接上一回。上一回我们说到用GeoDa可以自定义空间权重矩阵和空间关系,那么空间关系到底在我们的分析中,会产生什么样的影响呢?今天我们通过一个简单的例子来给大家示例一下:首先我们用常规的方式演示一下在GeoDa里面如何做莫兰指数:打开GeoDa,打开我们需要分析的数据,比如还是中国的人口GDP的shape file(数据获取在虾神的gitee&github上面,公众号发送原创 2021-07-27 08:43:26 · 4299 阅读 · 3 评论 -
新版白话空间统计(18)空间关系概念化之Geoda的面邻接构建及自定义
这是我上次发的,CSDN表示审核未通过,原因是可能是因为虾神是做空间统计的,所以一定要用上地图,结果:凡事用上地图的地方,都变成这样了:然后编辑直接审核,说你的文章违规违法……好吧,以后我把图片都删了,就发文字好了,大家想看图的,可以去虾神的公众号和虾神的知乎上去看。虾神的知乎号,看图来这里虾神的知乎号,看图来这里虾神的知乎号,看图来这里要是导航不过去,可以复制下面链接:https://zhuanlan.zhihu.com/p/258345714CSDN的被爬虫专..原创 2021-06-23 10:12:31 · 2719 阅读 · 0 评论 -
新版白话空间统计(17)空间关系概念化之面邻接
说在前面的话:本来在距离与面邻接关系之间,还有一个无差别区域的,但是在新版的ArcGIS里面,这个空间关系被取消掉了,因为无论是学术界和业界都觉得,这个东东用的机会实在太少,几乎没有机会使用,所以在新版本中,不在内置这种空间关系。本着考古的思维,先花五分钟简单把这种已经被淘汰的关系描述一下:无差别的区域(Zone of indifference)指的是“在一定的区域内,实行无差别化;超出这个区域,就实行距离衰减化”,其实就是把“反距离”和“固定距离范围”两个模型合二为一了。在进行无差别的区域建模原创 2021-06-01 15:18:59 · 2157 阅读 · 0 评论 -
新版白话空间统计(16)空间关系概念化之固定距离
CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D转发、转载和爬虫,请主动保留此声明。镇文神图:中学物理第一课就是参照物的说明,空间统计里面的各种分析,有着天然的参照物,也就是物理存在的空间特性:地理空间的客观性,说空间统计学赖以存在的根基之一,也是空间统计学在统计学家族里面得以列土封疆的底蕴之一。所以,整个空间关系概念化系列文章,我都会以这张图镇压气运。固定距离空间关系概念化里面一个比较容易被忽视的空间关系,但是它在很多时候又极其有用。比如在ArcGIS里面的热点分析中,固定距原创 2021-05-12 16:53:14 · 2069 阅读 · 0 评论 -
新版白话空间统计(15)空间关系概念化之距离
首先祭出镇文神图:空间统计学最核心的,就是对空间区域分布特性进行研究,所以要做任何空间分布分析,就需要定义什么是区域的概念——一个要素自然不能称之为区域,所以需要有多个要素凑在一起,才能称之为区域。所以,空间分布研究,第一步工作,就是要找到,谁和谁能够组成一个区域,即:谁是谁的邻居,谁和谁有临近关系。要说空间关系,第一反应肯定就是距离,正如“地理学第一定律”的“Tobler's First Law”(简称TFL),里面说的:“all attribute values on a geogr原创 2021-04-22 09:32:56 · 2828 阅读 · 0 评论 -
新版白话空间统计(14):空间关系概念化综述
CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D转发、转载和爬虫,请主动保留此声明。在前面的文章里面,我们反复强调,我们做任意空间分布的判定,都是由空间关系和属性关系共同作用所得到的最终结果。所以,空间统计分析与传统的统计分析,最大的区别就在于空间统计学把样本数据中由空间信息所带来的空间关系直接整合到了算法之中,并且作为本门学科最主要的支柱。如果取消掉空间相关的特性,空间统计学与传统统计学就没有多大的区别了。所以,我们从今天开始,准备用好几章的篇幅,好好给大家念叨一下空间.原创 2021-04-08 10:31:43 · 2959 阅读 · 1 评论 -
新版白话空间统计(13):随机的力量
CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D转发、转载和爬虫,请主动保留此声明。前文再续,书接上一回,先请出本节镇文神图:看到这张图,可能很多同学会问,随机不是没有分析的意义么?你这里的完美的是啥意思捏?难道说要让我们的数据都表现成随机才好么?那么我们今天来好好聊聊随机的力量。首先,校正一个观念——啥叫随机?有的同学看见随机,第一反应就是随机不就是乱么,乱的没有任何规律,乱得没有办法分析和预测?好吧,如果你是这样认为的,也不能说全是错的,但是没有认识到随机的原创 2021-04-06 09:38:28 · 1978 阅读 · 2 评论 -
新版白话空间统计(12):P值的表达以及空间统计上的特性
CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D转发、转载和爬虫,请主动保留此声明。上篇文章简单介绍了P值与Z得分的一些基本概念,大家其实也都知道,P值和Z得分其实是有一定的相应关系的,Z得分有正负两种结果,而P值有显著和不显著两种可能。如果按照我们一般的思维,P值和Z得分就应该有4种组合。不过实际上他们只有三种组合,如下:可以看见,只要P值不具备统计学上的显著特征,那么Z值不论是正负,都是一个结果。Z值的计算很简单,标准差在任何软件或者数学工具包里面里面都内置了计算.原创 2021-04-02 09:26:55 · 3523 阅读 · 1 评论 -
新版白话空间统计(10):空间统计中的零假设
上一节挖了个大坑——PZ值,不同软件里面,计算方法和表达方法是有所不同的,因为我们主要讲空间统计,所以我在这里会扣着ArcGIS来讲。在讲PZ之前,我们还是先再来看看一个统计学里面的基础...原创 2020-04-23 18:03:07 · 5764 阅读 · 5 评论 -
新版白话空间统计(9):置信度的初探
前面说到莫兰指数的时候,挖下了一个大坑——虾神在文章里面里面,一再强调:查看莫兰指数之前,先要看看PZ两个值,如果PZ两个值不可信,那么得到的莫兰指数也是不可信的——那么这个PZ值是何...原创 2020-04-14 08:13:24 · 2505 阅读 · 2 评论 -
新版白话空间统计(8):莫兰指数小结
本节对前面写的莫兰指数部分留下的一下小问题进行解答,里面包括一些读者朋友们通过邮件提出的一些问题。Q1:ArcGIS中,计算莫兰指数的工具里面的那个Row(行标准化)是拿来干嘛的?A:...原创 2020-04-10 08:19:13 · 27992 阅读 · 10 评论 -
新版白话空间统计(6):在ArcGIS中实现莫兰指数计算
上一篇简单说了一下莫兰指数的计算原理和计算公式,如果是学生或者基础研究者,鼓励好好的学习一下手算或者编程计算,所谓的基础不牢,地动山摇……但是对于工程界...原创 2020-03-23 08:15:11 · 37152 阅读 · 21 评论 -
新版白话空间统计(5):莫兰指数之计算详解
上次我们简单的介绍了一下学渣莫兰同学的逆袭之旅,梦想成为一个数学家的他最后阴差阳错的成为了一个统计学家,所以虾神不禁陷入沉思:好了,不说数学了,我们今天继续来说莫兰指数。我们先来看看莫兰...原创 2020-03-02 08:25:59 · 24839 阅读 · 13 评论 -
新版白话空间统计(4):莫兰指数之起源
本文是帕克.莫兰小传——献给伟大的统计学家,空间统计学先驱莫兰同学我们前面说了空间分布模式有随机、聚集和离散三种,不过这三种说法都是所谓的“定性”的称谓,而在分析里面,我们更需要的是“定...原创 2020-02-17 09:33:01 · 8901 阅读 · 2 评论 -
新版白话空间统计(3):空间分布模式
空间分布模式的英文是:spatial distribution pattern,所以也有的文章或者书上被翻译成空间分布格局或者空间分布范例。不过我一般习惯了称之为空间分布模式,下面就沿用...原创 2020-02-10 09:19:07 · 13826 阅读 · 5 评论 -
新版白话空间统计(2):空间自相关
空间自相关是学习空间统计学课程中的第一个拦路虎,据虾神所知,很多初学空间统计学的同学,在遇上这个词汇的时候,就准备放弃这一门本来可以很有意思的课程了。因为大家发现“空间自相关”这五个字,...原创 2020-02-06 09:45:12 · 22985 阅读 · 5 评论 -
新版白话空间统计(1):前言与地理学第一定律
前言2015年7月27日,虾神在csdn博客频道,首次放出第一篇白话空间统计,到今天已经4年多了。2020年,虾神重写白话空间统计。4年多的时间,从看山是山,到看山不是山,再到看山仍是山...原创 2020-02-03 17:21:25 · 8937 阅读 · 7 评论 -
新版白话空间统计(11):ArcGIS中的PZ值标尺
前面我为了一直省事,所以直接把P-value 和Z-scores给统称成了PZ值,实际上准确翻译应该叫做P值与Z得分,我就不一一校正了,另外,PZ的大小写在文中大家也自行忽略就好。首先,我们来看看在ArcGIS里面做空间自相关,当我们勾选了生成分析报告之后执行:在指定的地方会生成这样一个分析报告:(注意,在这个地方,不同的版本会有一些不同,建议使用ArcGIS10.4以上版本,而且在做空间统计的时候,请把把ArcGIS设置为英文版)打开这个分析报告,首先映入眼帘的,是这样的一个图形:原创 2021-03-31 08:50:58 · 4728 阅读 · 1 评论