Python地址数据解析、标准化

问题背景

        在对地址数据进行处理的过程中,现有的地址数据往往是不标准的,如数据中的维度可能有北京市、余杭区、祁县、淀山湖镇等不同精细度的样本,因此本文聚焦的主要问题是将地址数据统一标准化成省-市(区)-县的格式,如下图所示,原始地址和地址的层级分别为address和level,标准化后的地址与经纬度信息见表的其他部分。

导入Python库

import requests
import json
import pandas as pd
import time

1 正向地理编码:城市->地理坐标

        首先定义一个函数,输入为地址和自己的ak,输出为经纬度和level。

def crawl_lnglat(address, ak):   # 正向地理编码:城市->地理坐标
    url = f'https://api.map.baidu.com/geocoding/v3/?address={address}&output=json&ak={ak}'
    response = requests.get(url)
    info_dict = json.loads(response.text)
    if info_dict['status']==0:
        lng = info_dict['result
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值