系列文章目录
【空间统计学习笔记】一、基本概念入门理解
【空间统计学习笔记】二、空间分布模式
【空间统计学习笔记】三、聚类与空间聚类
文章目录
前言
前面讲解了一些空间统计的理论,这一讲概括一些空间大数据的应用,以及介绍复杂性科学及模拟计算,重点介绍在空间统计分析中常用的元胞自动机模拟。后续将补充一些元胞自动机的代码。加油噢。
一、空间大数据
1.空间大数据来源及爆发式增长
- 基础测绘数据: DLG、DRG、DOM、DEM
- 专题测绘数据: 国土、农业、林业、环保等行业地理数据
- 影像数据: 卫星、无人机、航飞、监控视频等
- 位置事件: 车辆轨迹、智能手机采集、灾害事件、外业工单等
- 互联网数据: 网页数据、社交网络数据、用户行为日志等
- 物联网-传感器数据: 气象监测站、重力感应仪、智能管线监测等
城市级收集信令数据每天超过10亿条
城市级车辆运行轨迹数据每天超过1亿条
省级气象观测数据每月超过2亿条
…
2.空间大数据三大典型应用场景
事务计算型应用:
传统需求,向分布式计算转移:
- 土地利用现状分析
- 土地利用变化监测
- 建设用地审批分析
- 生态红线与基本农田压盖
- 数据量大、运算复杂
辅助决策型应用:
- 多源数据融合分析
- 气象灾害等级评价
- 农作物生长适宜性分析
- 基于手机信令数据分析挖掘
洞察预测型应用:
- 人员出行轨迹分析
- 犯罪事件分析预测
- 车船到港时间预测
- 农作物生育期预测
3.大数据、移动互联、物联网、云计算、人工智能
例如,疫情期间常用的“基于时空关系的疫情数据洞察分析”,进行时空相关性的分析,哪些人之间产生了时空伴随?在数据量较少时,很简单,但在数据量爆炸式增长的现状下,计算越来越重要。
移动互联
1G - 1980s - 语音
2G - 1990s - 短信
3G - 2000s - 上网web
4G - 2010s - 视频
5G - 2020s - 万物互联的智能时代
云计算:数字时代的基础设施
- 数据不落地: 访问远程数据的效率如同访问本地数据
- 计算资源化: 计算能力将成为一种资源,可以共享和量化
- 平台轻量化: 软件将成为服务,可以分散、集合、快速部署和回收
- 连接智能化: GIS将充分发挥数字世界神经网络的作用,为一切提供智能的连接服务
二、复杂性科学Complexity Science
- 复杂性科学兴起于20世纪80年代,是系统科学发展的新阶段,也是当代科学发展的前沿领域之一。
- 复杂性科学的理论和方法被认为是科学研究的巨大的变革,将为人类的发展提供一种新思路、新方法和新途径。
①只能通过研究方法来界定,其度量标尺和框架是
非还原的研究方法论
②不是一门具体的学科,而是分散在许多学科中,是学科互涉的
③之间互不来往的界限,寻找各学科之间的相互联系、相互合作的统一机制
④力图打破从牛顿力学以来一直统治和主宰世界的线性理论,抛弃还原论适用于所用学科的梦想
⑤要创立新的理论框架体系或范式,应用新的思维模式来理解自然界带给我们的问题
好抽象,我看不懂,呜呜呜
电影《黑客帝国》《盗梦空间》就是对复杂性科学的一种思考,就好像在MINECRAFT里,又搭建了一台计算机,并且可以实现计算功能,这样套娃。梦中梦,模型中的模型
以购物行为为例,构建沙盒:虚拟购物世界 ,通过不断地模拟这个行为,来进行个性推荐。
复杂科学的核心技术手段:计算模拟
- 计算模拟是"计算机数值模拟方法"的简称。是依靠电子计算机,结合有限元或有限容积的概念,通过数计算和图像显示的方法,达到对各种工程问题和物理问题乃至自然界各类问题进行研究的目的。
- 在计算机上实现一个特定的计算,非常类似于履行一个物理实验。这时分析人员已跳出了数学方程的圈子来对待物理现象的发生,就像做一次物理实验。
例如,一个与地震相关的研究,可以通过计算机模拟一次地震来查看建筑是否能承受等。
计算模拟的两大基本方法
蒙特卡罗模拟
蒙特卡罗模拟是在二战期间,在原子弹研制的项目中,为了模拟裂变物质的中子随机扩散现象,由美国数学家 冯诺依曼 和 乌拉姆等人发明的一种统计研究方法。
蒙特卡罗模拟是以概率统计理论 为指导的数值计算方法。随机数是我们实现蒙特卡罗模拟的基本工具。蒙特卡罗模拟某一过程时,需要产生某一概率分布的随机变量。并且用统计方法把模型的数字特征估计出来,从而得到实际问题的数值解。
例如,在 概率论与数理统计中,学到的 几何概率,就可以用于求解0到pie之间的定积分。
问题。
蒙特卡罗基本思想是:
当所要求解的问题是某种事件出现的概率,或者是某个随机变量的期望值时,它们可以通过某种“试验”的方法,得到这种事件出现的频率,或者这个随机变量的平均值,并用它们作为问题的解。
元胞自动机模拟
元胞自动机是一类思想的总称,或者说是一个方法框架。其特点是时间、空间、状态都离散,每个变量只取有限多个状态,且其状态改变的规则在时间和空间上都是局部的。其可以看成是用一系列模型构造的规则构成,而非严格定义的物理方程或函数确定的规则驱动的动力学演化模型。
- 元胞自动机(cellular automata,CA)是一种时间、空间、状态都离散 ,空间相互作用和时间因果关系为局部的网络动力学模型,具有模拟复杂系统时空演化过程的能力。
- 在效能上,与图灵机的计算能力是等价的。
案例 比如 小牛吃小草的问题,两头牛可以生小牛,而小牛又需要吃一定数量的草才能存活,那么这片草地能供养多少头牛呢?这个问题就可以用元胞自动机来算出来。
四、元胞自动机
- CA是指一个具有时间跨度的模型,在该模型中一系列相同的细胞单元格分布在同一矩形空间,每个元胞单元格包含一个自动机(machine),一个元胞自动机是一个能够根据既定规则、以往状态以及邻近个体独立改变自身状态的实体。CA是一个离散的动态系统。CA需包括以下:
- cells: 有限数量的离散单元网格
- neighborhood:定义每个细胞单元的领域
- initial states :单元网格具有初始状态和条件
- rules : 一系列计算单元格状态变化的规则
1.元胞自动机的属性
- 反应-扩散等式:元胞的状态取决于扩散组件
- 离散性:时间、空间及系统状态均是非连续的
- 同步性:元胞的改变都是同步的,在同一时间跨度更新
- 规则性:按一定的规则进行排列
- 有限性:每个单元具有有限的属性并占据有限空间
- 交互性:元胞间可以相互交互
2.元胞自动机建模要素
- 空间网格: 元胞在空间中分布的空间格点的承载
- 领域:存在与某一元胞周围,能影响该元胞下一时刻的状态
- 状态集合:元胞的状态表达方式
- 演化规则:根据元胞及邻居的状态,决定下一时刻状态的动力学函数
这里后续将补充一些 使用python实现的元胞自动机 模拟程序。