python读取数据库PostgreSQL导出shapefile(shp)文件

1.现有数据和目标成果

1.1现有数据

源数据保存在数据库中,使用的数据库管理软件是PostgreSQL。

本质上来说,数据存储在数据库中是以记录存储在表(table)上实现的,在shapefile中也是以记录的形式存在属性表(dbf)。所以数据库中表的列(字段)可以与dbf表的列一一对应。数据库中数据形式大致如下:

 

1.2目标成果

众所周知,shapefile是ESRI公司制定的GIS数据的一种格式,一个正常的shapefile至少包括三部分:shp、dbf和shx。有关于shp文件等一系列说明,可以参考我之前的博客——shp系列,链接是

https://blog.csdn.net/Fan_z_0802/article/details/85078059

shp文件用ArcMap打开后如下(包括图形和属性表):

 

2.代码过程

2.1连接数据库获取数据

要获取数据库数据必须要先连接数据库,连接PostgreSQL的方法网上很多参考,也可以参考我源代码的方式。

执行SQL(结构化查询语言),获取数据库要导出数据的表的字段数,以及要导出的记录。

一个简单的示例如下:

'''连接数据获取数据,WHU_Fan,0706'''
def getData():
    '''databese是要连接数据库的名字,user是访问用户(创建数据库时设置),password是创建数据库的密码,host填localhost,端口为安装数据库时设置的端口'''
    '''这里是PostgreSQL的连接方法,MySQL也类似,端口可能不一样'''
    conn = psycopg2.connect(database='test2',user='postgres',password='admin',host='localhost',port='5432')
    cur = conn.cursor()
    
    ''''设置自己的sql语句'''
    '''例如'''
    tableName = 'outcome'
    commandFindColumn = "select COLUMN_NAME from information_schema.COLUMNS where table_name='%s' "% (tableName)
    
    '''执行SQL语句获取数据'''
    cur.execute(commandFindColumn)
    columnRows = cur.fetchall()
    
    '''SQL语句:导出outcome表的全部'''
    commandFindRecord = "select * from %s order by 相似度  desc"%(tableName)
    
    '''执行SQL语句获取数据'''
    cur.execute(commandFindRecord)
    recordRows = cur.fetchall()
    
    '''提交确认'''
    conn.commit()
    
    '''关闭连接'''
    cur.close()
    conn.close()
    
    '''返回数据'''
    return columnRows,recordRows

 

2.2解析数据

获取的字段变量columnRows,是一个list,顺序的包含数据库对应表的每一个字段。

获取的记录信息recordRows,也是一个list,包含所有满足条件的记录。

 

2.3写到shp中

1.调用函数连接数据库获取数据

2.创建shp文件

3.创建字段

4.写入图形和属性信息

5.关闭保存文件

代码如下:

'''outcome表导出到shp,WHU_Fan,0706'''
def writeToShp(filePath):
    '''调用连接数据库函数'''
    columnRows,recordRows = getData()
    
    '''创建shp文件w'''
    w = shapefile.Writer(filePath)
    
    '''创建字段,此处可以固定字段,或者灵活字段,根据需求改变'''
    '''本处字段暂时写固定已知的,可以改写成灵活的'''
    '''F 代表数值型,C 字符型'''
    w.field('任务id','F')
    w.field('来源', 'C')
    w.field('poi名', 'C')
    w.field('类型', 'C')
    w.field('纬度', 'C')
    w.field('精度', 'C')
    w.field('地址', 'C')
    w.field('地理位置', 'C')
    w.field('抓取时间', 'C')
    
    '''添加图形和属性信息'''
    for recordRow in recordRows:
        '''将字符型经纬度转化为数值型'''
        x = float(recordRow[5])
        y = float(recordRow[4])
        
        '''创建点状要素,坐标为经纬度'''
        '''创建其他类型要素类似,输入合理的坐标点即可,详细参考之前博客的shp文件说明'''
        w.point(x,y)
        
        '''创建对应的dbf属性信息,与图形一一对应'''
        w.record(recordRow[0],recordRow[1],recordRow[2],recordRow[3],recordRow[4],recordRow[5],recordRow[6],recordRow[7],recordRow[8],encoding='UTF-8')
        
    w.close()

 

3.源代码

#encoding:utf-8
'''written by WHU_fan,0705'''
import shapefile 
import psycopg2
from datetime import datetime

'''连接数据库获取数据'''
def getData():
    conn = psycopg2.connect(database='test2',user='postgres',password='admin',host='localhost',port='5432')
    cur = conn.cursor()
    tableName = 'outcome'
    commandFindColumn = "select COLUMN_NAME from information_schema.COLUMNS where table_name='%s' "%(tableName)
    cur.execute(commandFindColumn)
    columnRows = cur.fetchall()
    '''导出outcome的成果'''
    commandFindRecord = "select * from %s where poi名2!='' order by 相似度"%(tableName)
    cur.execute(commandFindRecord)
    recordRows = cur.fetchall()
    conn.commit()
    cur.close()
    conn.close()
    return columnRows,recordRows

'''outcome表导出到shp'''
def writeToShp(filePath):
    columnRows,recordRows = getData()
    w = shapefile.Writer(filePath)
    
    '''添加字段'''
    w.field('任务id','F')
    w.field('来源', 'C')
    w.field('poi名', 'C')
    w.field('类型', 'C')
    w.field('纬度', 'C')
    w.field('精度', 'C')
    w.field('地址', 'C')
    w.field('地理位置', 'C')
    w.field('抓取时间', 'C')
    
    for recordRow in recordRows:
        x = float(recordRow[5])
        y = float(recordRow[4])
        w.point(x,y)
        w.record(recordRow[0],recordRow[1],recordRow[2],recordRow[3],recordRow[4],recordRow[5],recordRow[6],recordRow[7],recordRow[8],encoding='UTF-8')  
    w.close()

if __name__ == '__main__':
    '''获取当前日期,得到一个datetime对象如:(2019, 7, 2, 23, 12, 23, 424000)'''
    '''#将获取到的datetime对象仅取日期如:2019-7-2'''
    today = datetime.today()
    today_date = datetime.date(today)
    
    writeToShp('shapefile/point_' + str(today_date))
    print('succeed')

 

4.属性表乱码问题

问题:导出的shp用ArcGIS打开,属性表发生乱码。

解决:

1.python文件编码设为UTF-8    #encoding:utf-8

2.写属性表时编码设为UTF-8  encoding='UTF-8'

3.cmd运行命令(关键):

reg add HKEY_CURRENT_USER\Software\ESRI\Desktop10.2\Common\CodePage /v dbfDefault /t REG_SZ /d UTF-8 /f

 

5.成果总结

1.导出shp的过程比较简单,主要是使用开源库,不需要从底层写起。

2.创建字段时需要根据字段的属性设置对应编码(“C”,“F”,还是其他)

3.使用ArcGIS查看效果,调试代码。

 

  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值