一行代码实现地址信息解析

21cbc2d07faa7a8dc712ef4b889e936e.gif

作者 | 费弗里       

来源 | Python大数据分析 

我们即将学习的是:一行代码解析地址信息

在日常数据处理的过程中,有时候拿到手的是完整的地址信息,如果需要从地址信息中解析出相应的各级行政单元名称,方式有很多,而今天要介绍的方式只需要一行代码即可快速实现。

首先我们需要安装jionlp这个非常好用的文本预处理工具包,建议使用国内镜像安装:

pip install jionlp -i https://pypi.douban.com/simple/

安装完成后,只需要使用其parse_location()接口即可进行地址信息的解析,且具有多种不同的功能:

  • 基础的省市区信息提取

35c37900d83ac406378914dc7c564db9.png
  • 街镇乡、村或居委会信息提取

通过设置参数town_village=True,还可以额外尝试提取出街镇乡、村或居委会信息等级别的信息字段:

08e8376b7227b91385780a1be88ca42a.png
  • 自动补全省市信息

若地址信息中缺失省市信息也无妨,在不存在歧义的情况下,parse_location()会自动关联并补全相关信息:

0d74c716ff79a4798fa6bb4053b5b594.png

除此之外,parse_location()还具有旧地名修正为新地名、自定义行政区划词典等功能,你可以在其官方文档https://github.com/dongrixinyu/JioNLP/wiki/Gadget-说明文档#地址解析中了解更多。


本期分享结束,咱们下回见~👋

ec2b17480520422748c23d4f5c7f1496.gif

往期回顾资讯变身「毒」苹果?全球首个DMP漏洞
资讯
程序员化身“侦探”识破AI律所骗局
技术制作数据面板大屏的Python模块
技术10个有趣的Python高级脚本!



分享
点收藏
点点赞
点在看
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值