![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
空间分析
文章平均质量分 89
才华横溢吴道简
实践出真知。
展开
-
GeoDa入门:安装、专题图、莫兰指数
之前写过GeoDa,不过比较分散,这里把它作为一个专题,单拎出来写。一、GeoDa简介GeoDa是一个免费、开源的空间数据分析软件。通过探索和建模空间模式,GeoDa向用户提供了全新的空间数据分析视角。GeoDa支持很多空间算法,例如莫兰指数、高低聚类,支持多种文件格式,例如csv、shp等等,支持多种图表,例如折线图、散点图等等,支持多种底图,例如OSM、高德等等。用作数据可视化和图表分析,GeoDa比QGIS更简单好用。更多关于geoda的介绍,可参见官网:https://geoda原创 2021-07-07 23:08:29 · 6466 阅读 · 4 评论 -
空间分析:6.总结
一直都想善始善终,写得全一些,但时间精力总是不够,只能完成最终设想的80%。我们对一个现象进行空间分析,要从多个维度去考虑,例如北京房价为什么这么贵这个问题,首先要考虑,这个论题是否成立,北京房价是不是贵;北京房价贵,是全北京都贵,还是某些地方贵,如果是某些地方贵,那是哪些地方贵,引起这些地方贵的原因是什么,学区,还是人员收入……我们要了解这些,就要有数据,多方渠道获取数据,获取数据的手段是爬虫。空间分析,也是数据分析的一种,数据收集、数据处理,是数据分析工作的90%,剩下的10%才是分析。原创 2020-12-14 22:51:19 · 346 阅读 · 0 评论 -
空间分析:5-1.空间分析库PySAL的使用
Pysal与geoda非常相似,一个通过写脚本来实现空间分析,一个通过软件操作来实现空间分析。Pysal的官网对于自己的介绍是,开源、跨平台的地理空间数据分析库。http://pysal.org/Pysal能干什么?空间分析+可视化,就够了。一、pysal安装安装非常简单,把相关的包都装一下。pip install pysalpip install esdapip install geopandaspip install splot或者打开Pycharm.原创 2020-12-14 22:46:28 · 4593 阅读 · 1 评论 -
空间分析:4-1.分词模型hanLP简介与安装
自然语言处理NLP相对来说,是比较火的方向,分词模型很多,选起来容易眼花缭乱,我最开始使用过结巴分词,简单易用。后来又看到了hanLP,介绍上说,它是用《人民日报》语料库训练的,深得我心,于是拿来用用。hanLP的git连接:https://github.com/hankcs/HanLP/hanLP的官网:https://www.hanlp.com/一、anaconda安装Python3.6因为hanlp依赖TensorFlow,但TensorFlow不支持Python3.6以上版本,所以我原创 2020-11-28 23:27:20 · 825 阅读 · 1 评论 -
空间分析:3-3.geoda计算莫兰指数
莫兰指数是一个地学统计概念,用来表示空间自相关性。我们使用geoda来计算一下北京二手房的莫兰指数,看看它的空间自相关。一、莫兰指数莫兰指数是最常用的空间自相关指标,最早由统计学家莫兰提出,所以叫做莫兰指数,很好听的名字。莫兰指数计算公式:其中:看着有点晕,没关系就是个统计公式,我们只需要知道通过这个公式能计算出来莫兰指数。莫兰指数的取值范围是[-1,1]。莫兰指数结果如果在0到1之间,则为正相关,表示具有相似属性的对象聚集在一起。莫兰指数结...原创 2020-11-24 00:13:56 · 15188 阅读 · 3 评论 -
空间分析:3-2.geoda地图与探索分析
先来个简单的,看下geoda的地图设置(地图)与图表设置(探索分析)。数据就是之前爬下来的北京二手房房价数据shp文件。一、打开shp数据在geoda工具条中选择打开,打开连接数据源对话框,选择ESRI Shapefile(*.shp)类型。在弹出的Choose a spatial file to open对话框中,选择需要打开的shp文件。即完成了数据加载。二、加载底图在数据窗口,选择网络底图,选择需要的底图,即完成加载底图。选择底...原创 2020-11-24 00:10:02 · 3922 阅读 · 0 评论 -
空间分析:3-1.geoda简介及安装
除了QGIS外,我们可以了解更多的GIS开源软件,例如geoda。Geod是一款免费、开源的空间分析软件,基于c语言开发,在它的官网上,http://geodacenter.github.io/index-cn.html,有关于它的中文介绍。一、geoda简介GeoDa是一个免费、开源的空间数据分析软件。 通过探索和建模空间模式,GeoDa向用户提供了全新的空间数据分析视角。Geoda支持很多空间算法,例如莫兰指数、高低聚类,支持多种文件格式,例如csv、shp等等,支持多种图表,例如.原创 2020-11-17 22:37:48 · 10967 阅读 · 2 评论 -
空间分析:2-4.Python生成泰森多边形
代码注释很详细,如何生成泰森多边形和德洛内三角网。用的是Python3,使用了scipy和matplotlib、numpy、shapely,引用matplotlib主要是为了看一下效果。注释很详细,看代码就行。from scipy.spatial import Voronoi,voronoi_plot_2dimport matplotlib.pyplot as pltimport numpy as npfrom shapely.geometry import Polygon, Li...原创 2020-11-11 02:22:03 · 4050 阅读 · 2 评论 -
空间分析:2-3.Python生成德劳内三角形
这篇看怎么用程序生成德洛内三角形。Python3,引用了shapely包,其中triangulate是生成德洛内三角形的方法。from shapely.ops import triangulatefrom shapely import wktfrom shapely.geometry import MultiPointf = open(r'point.txt','r',encoding='utf-8')flines = f.readlines()points = []# line是这样原创 2020-11-11 01:59:29 · 986 阅读 · 1 评论 -
空间分析:2-2.QGIS生成德劳内三角形和泰森多边形
散点很多分析没有办法做,邻域分析之类的,只有面才能做。所以我们需要想办法,将散点转成面。这里介绍两个QGIS由散点生成面的方法。一、打开工具箱QGIS——处理——处理工具箱,或者快捷键ctrl+alt+t,打开处理工具箱。二、德洛内三角形在处理工具箱的搜索框内,输入Delaunay,打开QGIS地学算法——矢量几何图形工具——德洛内三角剖分。弹出德洛内三角剖分对话框,输入图层选择散点文件,勾选“执行算法后打开输出文件”,点击run就行,会生成一个临时图层。...原创 2020-11-11 01:50:22 · 2831 阅读 · 0 评论 -
空间分析:2-1.QGIS生成热力图
将房价数据用QGIS生成个热力图,用直观而粗略的方式感受一下。一、数据转换先把文本数据转成shp文件。1.点击添加文本数据图层。2.选择文件。3.根据文本格式,横坐标选择field_13。4.根据文本格式,纵坐标选择field_14。5.点击ok。坐标参照系选择默认的EPSG:4326,点击确定。图层面板,选中图层,右键另存为,将矢量图层另存为shp格式。二、修改属性以单价获取热力图的色值,所以我们需要有字段描述单价...原创 2020-11-10 00:00:56 · 2043 阅读 · 2 评论 -
空间分析:1-5.爬取北京大公司名称工资位置
房价还受周边群体收入影响,例如后厂村这种地方,房价高企应该是被腾讯、百度托起来的。所以,我们还要获取一份北京大公司的收入和位置的数据。基本的数据还是靠搜索。能把房价抬起来,得具备两个条件,薪酬丰厚,人数多,企业和行业需要有规模效应。规模效应有两种表现形式,一个是像后厂村,有腾讯、百度两家大厂;一个是像金融街,虽然没有特别大的公司,但金融从业者聚集于此。一、公司名录与工资不管如何,我们也需要在网上找到一个获取各企业工资的数据源,找了半天,找到一个不那么不靠谱的网址,职友网:..原创 2020-11-08 23:44:47 · 455 阅读 · 0 评论 -
空间分析:1-4.获取北京市小学排名位置
为了验证房价是否受到学区的影响,所以我还要获取北京市小学的排名和位置。一、获取排名数据排名数据好获取,直接百度搜索一下。百度文库《2020年北京最全小学排名》:https://wenku.baidu.com/view/bef6d8217dd5360cba1aa8114431b90d6c8589f9.html把数据放在Excel里面,规整规整。我猜应该是一流一类>一流二类>二流一类>二流二类这样的排名。二、获取坐标数据有校名和排名了,我们还需要..原创 2020-11-04 23:31:15 · 355 阅读 · 0 评论 -
空间分析:1-3.爬取北京房价数据
房价数据,从房产交易网站上获取就行。.一、目标网站分析因为我最近也在拿贝壳看房,所以就试着拿一下贝壳的数据吧。只要能分析好网络响应,数据还是挺好拿的。贝壳找房有一个地图找房的功能,其他平台应该也都有:https://map.ke.com/map/110000/ESF/通过这个页面进行矩形遍历,能获取房源数据。在写脚本拿数据之前,先分析一下贝壳找房这个地图找房功能。贝壳找房,地图找房有3个功能,一个是地图分级显示房源,一个是地铁找房,一个是画圈找房。从布局...原创 2020-11-04 23:28:09 · 1329 阅读 · 5 评论 -
空间分析:1-2.爬取北京轨道交通数据
为了查看各小区周边的交通是否便利,我们还需要获取轨道交通线路及出入口数据。获取地铁站和出入口数据,可以使用高德地图的webapi。获取轨道交通线的数据,直接解析高德地图的页面响应。一.获取地铁站和出入口数据把获取小区的脚本改一改,就能获取地铁站及出入口数据了。步长改的大一些,地铁站一共没有多少个。import requestsfrom shapely.geometry import Polygonfrom shapely import wktfrom req...原创 2020-11-02 23:36:03 · 2444 阅读 · 0 评论 -
空间分析:1-1.高德地图获取北京所有小区的POI
我们使用高德开放平台https://lbs.amap.com上的webapi服务,获取POI数据,严格说来不算爬虫,就是调数据接口获取数据而已。步骤也很简单。1.获取北京的范围。2.将北京范围拆分成设定步长的网格,用每个网格矩形搜索小区数据,如果搜索到的数据量大于阈值,则将网格拆分成四个,如此递归,直到矩形搜索到的数据量小于阈值。3.用2中获取的网格调用接口,获取小区数据,把所有网格的数据汇总到一起就可以了。稍稍有点难度的,可能就是网格拆分的递归,但只要想明白了,就也很简单。接...原创 2020-11-02 23:30:52 · 3751 阅读 · 13 评论 -
空间分析:0.目的与步骤
一、目的空间分析总的说来,应该有三步:1.整理数据。2.数据可视化。3.量化分析。因为我一直比较好奇,北京房价有多贵,为什么贵,所以假期抽空就用常规的空间分析方式与步骤,对北京小区的分布和房价做了一个可视化的参考,并对其进行了建模分析。以下是粗浅的效果:1.所有房源与地铁线路的叠加。2.各房源的售卖属性。3.均价最高的100处房源分布。4.均价最高的100处房源简介词频统计。出现频次最高的是金融街,其次是德胜里。5.热力图6.影..原创 2020-11-02 23:24:34 · 844 阅读 · 1 评论