自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

以推广空间分析和空间数据挖掘为己任,致力于在GIS界传递分析价值

  • 博客(421)
  • 收藏
  • 关注

原创 白话空间统计十四:高/低值的聚类(下)

上一篇讲了General G统计方法的一般性解释,那么这篇继续把这个内容讲完。 开始我们说了,如果高值和低值区域同时出现了聚类,就变成了拿这板砖互拍的情况。但是还有的时候,出现更奇葩的情况,比如你用其他的工具(比如局部莫兰指数、热点分析一类的,这些工具以后我们会慢慢说到。)计算出来,发现这份数据统计特征值真是极高的,但是同样一份数据,到了General G统计算法里面之后,发现,咦,怎

2015-08-28 09:40:30 17708 2

原创 白话空间统计十四:高/低值的聚类(上)

衡量空间自相关的时候,用的参数是Moran'I(莫兰指数),那么在衡量搞低值聚类的时候,用的也是一个指数,这个指数叫做 General G 指数。

2015-08-26 09:57:57 31317 3

原创 白话空间统计十三:零假设(补记)

说在前面的话:前面花了好多章来讲各种数据分析的方法和例子,突然发现我原来设想的主线乱了。我的设想是对空间统计进行科普型的描述,结果写到后面,特别是这几章(准确说是从填中位数中心的算法坑开始),幸好有吴道长果断提醒,说我偏离方向了,我才豁然省悟。再次友情感谢吴道长(PS:吴道长是GIS圈子里面古玩玩的最好的,古玩界里面,GIS技术最好的综合性人才)。所以从今天开始,我继续把空间统计里面那些绕口的理论

2015-08-24 14:21:45 6644 6

原创 白话空间统计十二:R语言对点数据分析的实现(2)可视化

昨天我们简单的讲了R语言如何对点数据进行分析,今天继续把这个内容说法,其实R语言是非常强大的,他的强大之处,可能超出了你的想象的。 不过R语言也有缺点,最大的缺点就是所有的一切分析过程,都要通过敲命令的方式来实现,对于推广了超过10年的鼠标这种喜闻乐见的标准电脑外设来说,全部采用文本模式进行交互仿佛已经是远古时期的标志一样(不过很多电视剧里面,电脑高手的表现都是在键盘上运指如飞,他们从来不

2015-08-23 18:40:43 6210 1

原创 白话空间统计十二:R语言对点数据分析的实现(1)

前段时间,有人批评我写白话空间统计的博客是在写软文给ArcGIS平台和Esri打广告,话说这个实在是太恭维我了。如果读到空间统计,而且还能读懂的人,不可能没有听说过ArcGIS软件吧,这种情况到底是先有鸡还是先有蛋,自然一目了然了。 虽然虾神在Esri中国干了好多年了,给公司打打广告也是理所当然的事情。但是写博客的时候确实还真没有这个想法,不过既然有人批评了,那么虾神我先挑明一下这系列白话

2015-08-22 20:53:40 7067 6

原创 白话空间统计十一:线性方向平均值

前面我们说的都是点数据的分析,今天来说说一个用于分析线要素的算法(工具),就是线性方向平均值(LinearDirectional Mean )。 总所周知,线要素只有两个属性,一个是长度,第二个就是方向,而对于人类的认知来说,对方向的重要性丝毫不亚于位置的重要性。 对线数据进行统计的时候,首先就是了解他们的方向,如果只有一条线段,那么方向当然就不用统计了。但是如果线段数据非常多的时

2015-08-21 12:58:39 6470 1

原创 白话空间统计之十:标准距离

标准距离在空间统计里面也是一个常用的方法,因为它可提供有关中心周围要素分布的单一汇总度量值(此方法类似于通过标准差测量统计平均值周围数据值的分布)。

2015-08-20 13:54:24 9704 3

转载 白话空间统计之九:方向分布(标准差椭圆)

终于写到我最喜欢的一个的工具(算法)了,方向分布是虾神我接触的第一个空间统计工具,也是每次讲空间统计必须要讲的一个,也是对点数据分析中很有用的一个工具。 点模式的分析中,...

2015-08-19 14:56:59 2290 1

原创 白话空间统计之九:方向分布(标准差椭圆)修正版

方向分布工具在空间统计中是综合能力最突出的工具之一,有着广泛的应用,在我们的分析和数据探索的时候,能够起到非常重大的作用。

2015-08-19 14:43:00 56102 17

原创 白话空间统计番外篇:中位数中心算法

其实我一直是不愿意填算法坑的……主要是自己的数学水平很一般,很容易出现填坑不成自己反被埋的情况,但是这个坑不填又不行,所以在填坑之前说明:这个仅是虾神我自己的理解,不代表原文(限于能力问题,数学论文确实不怎么能读透),如果有疑惑或者错误,请自行查阅原始论文,虾神只负责科普。

2015-08-18 15:46:24 6110 2

原创 空间统计之八:平均中心和中位数中心

本来应该分成两篇来写的,但是这两种中心的算法和应用都很接近,所以就合并成一篇文章来写了。 昨天讲了中心要素,因为中心要素是要从原来的要素中去选择一个已有的,所以算出来的,与我们观念和感知中的“中心”这个概念,还是差距很大,所以今天来讲讲这两种中心的计算方式和应用范围。 我们来看看三者之间的不同,如下图:  可以看到,计算出来的结果各有不同,首先中心要素我们就不说了,大家

2015-08-17 15:33:23 13056 2

原创 空间统计之七:中心要素

写到这一章,空间统计系列的内容已经写了七章了,前面的所有内容包括了空间统计的几个基本理论基础,如空间自相关、空间异质性、莫兰指数、空间关系概念化以及他们之间的量化度量方式P值和Z得分等,那么空间统计学与经典统计学在理论上的不同点,就说得差不多了。毕竟空间统计学还是发源于经典统计学上面的,经典统计学上面的很多概念,在空间统计学里面也照样能用得上,所以从今天开始,我们会介绍一些经典统计学上的概念内容在

2015-08-16 18:19:16 6927

原创 白话空间统计之六:平均最近邻

平均最近邻可以得出一份数据的具体聚集程度的指数,通过这个指数,可以对比不同数据中,哪个数据的聚集程度最大。适用于对固定研究区域中不同的要素进行比较。比如在同一城市范围内,不同类型的企业之间的分布情况的研究;或者同一类型的企业,在固定区域以内,随着不同年份的变化情况的研究。

2015-08-11 15:49:48 29760 12

原创 白话空间统计之五:空间关系的概念化(下)

空间关系的概念化,在ArcGIS中,一共是有7种。前面我们说了反距离、距离范围、无差别区域和面邻接四种,后面还有三种今天一并说完。 后面的几种,其实也都是在前面的那些“简单粗暴”的模型中发展而来的,正所谓“大道至简”一点也没错。  五、K最近相邻要素 所谓的K最近相邻,就是指在一定的范围内,都算相邻的要素,这个概念是“距离范围”模型改良之后生成的。距离范围是以一定距

2015-08-09 17:31:56 12088 3

原创 白话空间统计之五:空间关系的概念化(中)

空间关系的概念化(中) 上文说的两种空间关系概念化虽然是最常用,但是总给人一种简单粗暴的感觉,所以业界和学术界由搞出了各种各样的空间关系概念化的模型。 首先,就是把两种最简单的概念化给组合起来了,就是下面这种所谓的“无差别区域”法。 无差别的区域(Zone of indifference) 这个名词和翻译,总是让人感觉到怪怪的,但是实际上确很简单,其的意思就是“在一

2015-08-08 17:57:44 13247 1

原创 R-ArcGIS探秘(1)安装以及Sample运行

在今年的全球用户大会上,Esri官方公布了R-ArcGIS的官方示例,在ArcMap和ArcGIS pro中,直接通过Toolbox可以调用R的分析工具包,将R的分析能力直接作用在ArcGIS上面。打通了两大工具之间的壁垒,不能不说,是分析界的一大盛事啊。 视频截图如下: 总所周知,R在数据分析领域的地位,犹如JAVA在编程语言领域的地位,简直就占据了开源软件的头把交椅

2015-08-07 10:58:24 10338 21

原创 白话空间统计之五:空间关系的概念化(上)

空间统计分析与传统的统计分析,最大的区别就在于空间统计学把空间信息和空间关系都直接整合到了算法之中。如果取消掉空间相关的特性,空间统计学与传统统计学就没有多大的区别了。 因此在做空间统计时,都要求在分析之前进行“空间关系的概念化”。这个名词说起来很绕口,其实意思就是,你需要在分析时候,使用的“空间”这一概念,进行一个定义。 通俗的来说,空间很多时候就等于“距离”,特别是在生活中,我

2015-08-06 16:40:16 18765 1

转载 ArcGIS插值分析简介

需要原始PPT的,请与虾神联系,加虾神的个人微信号 ...

2015-08-05 19:19:21 840

原创 白话空间统计之四:P值和Z得分(下)

上篇讲了P值与Z得分的一些基本概念,大家其实也都知道,P值和Z得分其实是有一定的相应关系的,Z得分有正负两种结果,而P值有显著和不显著两种可能。如果按照我们一般的思维,P值和Z得分就应该有4种组合。不过实际上他们只有三种组合,如下:可以看见,只要P值不具备统计学上的显著特征,那么Z值不论是正负,都是一个结果。那么为什么P值如此之重要呢?上一篇文章说过了,P值是用

2015-08-03 17:43:57 32933 6

转载 慎用P值:它让研究结果不可靠

慎用P值:它让研究结果不可靠 2015-08-03 雷吉娜·鲁佐虾神daxialu 撰文 雷吉娜·鲁佐(Regina Nuzzo) 翻译 郭凯声本文作者 雷吉娜·鲁佐是一位自由科学撰稿人,也是美国加劳德特大学统计学副教授。对于马特·莫托尔(Matt Motyl)而言,2010年中有那么短暂的一刻,一项耀眼的科学荣誉眼看就唾手可得:他发现偏激人士的确是以“非黑

2015-08-03 17:41:14 8841

转载 偷懒的虾神

其实好多人都在问虾神,互联网如此火爆,好多同事都跳槽了,你为什么如此淡定? 要说视钱财如粪土这种高风亮节,虾神是绝对没有的。但是为什么还能如此淡定的在公司干活呢? 其实一...

2015-08-01 19:51:11 892 1

原创 白话空间统计之四:P值和Z得分(中)

要说P、Z之前(本文的P、Z写法,请忽略大小写),我们先看看一个中学化学的概念:PH值。另外,还要纠正一个说法,p是一个值(p value),而z是一个得分(z scores),上篇文章中,称谓出错了。就像上面那个PH试纸的标尺,从中间往两边延伸,表示酸碱的强度。理论上,自然界的物质,基本上以7为中心的泊松分布,就像下面这样:相对于极度的强酸和极度的强碱

2015-07-31 16:23:14 59180 17

转载 白话空间统计之四:P值和Z值(中)

要说P、Z之前(本文的P、Z写法,请忽略大小写),我们先看看一个中学化学的概念:PH值。 另外,还要纠正一个说法,p 是一个值(p value),而z是一个得分(z sc...

2015-07-31 16:16:20 26622 5

原创 白话空间统计之四:P值和Z值(上):零假设

本来今天想要讲讲软件操作的,后来发现好像还有好几个重要的指标没有说,干脆等全部说完在讲操作吧,否则操作出来的结果会发现大量的“不明觉厉”。    首先是空间统计里面很神秘的两个值:P值和Z值。    要说这两个值之前,还是要复习一下统计学的概念,毕竟空间统计的理论基础还是建立在经典统计学上面的。首先,统计学里面,有一个叫做“零假设”的概念非常厉害,一定要说说。

2015-07-30 16:33:05 35970

原创 白话空间统计之:Moran's I(莫兰指数)

Moran's I这个东西,官方叫做:莫兰指数,是澳大利亚统计学家帕特里克·阿尔弗雷德·皮尔斯·莫兰(Patrick Alfred Pierce Moran),在1950年提出的。一般是用来度量空间相关性的一个重要指标。

2015-07-29 16:58:07 143517 15

原创 白话空间统计之:空间异质性

横看成岭侧成峰,远近高低各不同。 不识庐山真面目,只缘身在此山中。 ——苏轼《题西林壁》 庐山本体就在那个地方,它本身是不会发生任何变化的,但是因为你所处的位置不同,获得的观察结果也不同。

2015-07-28 17:02:51 51327 11

原创 白话空间统计之:空间自相关

空间自相关,肯定是空间统计里面第一个拦路虎了,很多人遇上了这个高大上的词汇,立刻就发现,这五个字我好像都认识,但是到底说了啥?不知道。如果翻开各种教材,从统计学到数学到物理学,各种解释都摆出了一副“老子就是高大上学霸,屌丝学渣勿扰”的样子,这个东西真得就那么难么?

2015-07-27 21:58:05 76725 28

转载 元明以下之省区制度

本文节选于钱穆大师的《中国历代政治得失》 钱穆(1895年7月30日—1990年8月30日),江苏无锡人,字宾四,笔名公沙、梁隐、与忘、孤云,晚号素书老人、七房桥人...

2015-07-22 20:53:38 337

转载 趣文:编程语言伪简史

警告:• 原文中的内容不一定都是真实的。• 为了照顾那些幽默感退化的人们,维基百科有一个主题关于:History ofprogramming languages1801...

2015-07-21 20:52:42 285

转载 预言性的基于事例推理技术(中文译本)

预言性的基于事例推理技术 我们为了更好的进行业务决策和防范因为信息系统和服务系统出现的故障,从而导致灾难性错误,因此对各种数据管理和信息监控平台进行了大量的投资,...

2015-07-11 19:05:27 179

转载 预言性的基于事例推理技术(英文原文)

Predictive Case Based ReasoningDespite heavy investment in data management and monito...

2015-07-11 19:05:27 238

原创 预言性的基于事例推理技术

预测分析平台使企业能够充分利用所有的企业数据——从历史的结构化市场数据到新形式的非结构化大数据,来驱动我们更快更明智进行决策,并且还可以针对系统故障进行预先的告警。用户通过构建各种复杂的数学模型来探讨各种变量之间的关系,以揭示以前隐藏在数据中的一些模式,识别各种分类,进行关联分析和执行精准细分。虽然其中的很多技术都不是最新的,但是这些基本技术也在不断进步——利用多核和并行处理技术,可以将整个数据库加载到内存中,以实行

2015-07-11 18:55:07 1838 1

转载 从“游击队”到“正规军”:虾神成长史

老夫卢萌,江湖人称大虾卢,后来经江湖同道抬爱,慢慢进阶成了虾神。从写代码的风格就可以看出来,以前用com.dxl作为包名,现在都改成用com.gx了(god ...

2015-07-04 18:43:25 682

转载 2015年6月济南互联网+会议资料

2015年6月,济南地理信息与互联网+会议全部资料,包括如下内容:下面点击原文也可以找到,记住密码就行 ...

2015-06-04 13:54:47 158

原创 使用Pycluster包进行聚类分析实例

人类在几千年前就认识到了所谓的聚类和分类,是用来认知和描述万事万物之间关系的主要方法。不论是否受过高等教育,聚类和分类的思想都根深蒂固的在人类的思想中。Pycluster包是东京大学医学研究所,人类基因研究中心的米歇尔德勋(Michiel de Hoon),星矢井本(Seiya Imoto),宫野悟(Satoru Miyano)等人编写的开源算法工具包,提供了C/C++、python和 Perl三个版本

2015-06-03 21:33:46 8874 9

原创 空间点数据分析与ArcGIS

自然界中任何一个带有位置信息的个体都能被抽象为一个空间点数据,“点”的模式在自然与社会经济中都是普遍存在的,对点数据的分析,主要分为两大类:1、点数据本身模式的识别和探索。2、通过点模式的显示的信息,进行进一步的预测和知识总结。

2015-05-30 12:01:15 26027 1

转载 人类会把命运交给算法吗?

政府的决策越来越多的依靠计算机来完成。特别是近些年来,辅助决策系统和专家系统的持续火爆,让越来越多事务交给了计算机软件。听起来很像是科幻小说里面的内容,但是运用计...

2015-05-10 21:19:35 244

转载 那年那兔之狗大户

愿我有生之年,得见您君临天下。。。

2015-05-09 11:01:15 495

原创 大数据的目的:生产小型数据

弱水三千,只取一瓢。如果拥有着一切,那么我只是需要能够解答我关心的问题的答案。大数据资源的目的,就在于生产各种小型的数据集。

2015-05-03 16:14:58 2679

原创 大数据何去何从?——大数据企业的进化之路

大数据何去何从?——大数据企业的进化之路    Esri 中国 卢萌      通常,推动大数据发展的起兴都是临时性的,一些企业和机构在运营的过程中被迫存储和通过检索收集到的大量的数据(无论他们想要与否),所以,大数据的获取,一般是通过一下几种不同的机制来实现:         1、一个企业在其正常的经营活动总已经收集到了大量的数据,并且真在寻求根据需要来对数据进行组织,以

2015-04-27 13:37:21 2200

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除