最近在使用Python中的geopandas包操作地理空间数据,由于数据量过大采用PostgreSQL中的PostGIS进行管理操作,最后查到了一些资料代码插入数据库,国内网上没有相关内容,这里分享一下,自己以后也需要对大批量数据操作,这里对比下不同数据量下的插入性能。
环境:
- 笔记本windows7 64位(内存8G) Python 3.5.2(Anaconda3)
- PostgreSQL 10 PostGIS 2.4.2
- geopandas 0.3.0 sqlalchemy 1.2.2 GeoAlchemy2 0.4.2
基本流程是生成n个随机的空间散点,然后对比下不同n取值下的插入效率,所有的代码如下:
import pandas as pd
import geopandas as gpd
import time,datetime
import numpy as np
import shapely
from geoalchemy2 import Geometry, WKTElement
from sqlalchemy import *
start = time.clock()
print(str(datetime.datetime.now()) + " : " + " start")
print('======================