作者 | 费弗里
来源 | Python大数据分析
我们即将学习的是:一行代码解析地址信息
。
在日常数据处理的过程中,有时候拿到手的是完整的地址信息,如果需要从地址信息中解析出相应的各级行政单元名称,方式有很多,而今天要介绍的方式只需要一行代码即可快速实现。
首先我们需要安装jionlp
这个非常好用的文本预处理工具包,建议使用国内镜像安装:
pip install jionlp -i https://pypi.douban.com/simple/
安装完成后,只需要使用其parse_location()
接口即可进行地址信息的解析,且具有多种不同的功能:
基础的省市区信息提取
![35c37900d83ac406378914dc7c564db9.png](https://i-blog.csdnimg.cn/blog_migrate/1e02804c21dfe98710616ecd1a15d605.png)
街镇乡、村或居委会信息提取
通过设置参数town_village=True
,还可以额外尝试提取出街镇乡、村或居委会信息等级别的信息字段:
![08e8376b7227b91385780a1be88ca42a.png](https://i-blog.csdnimg.cn/blog_migrate/becd4bb190002ad70b50bb702114125e.png)
自动补全省市信息
若地址信息中缺失省市信息也无妨,在不存在歧义的情况下,parse_location()
会自动关联并补全相关信息:
![0d74c716ff79a4798fa6bb4053b5b594.png](https://i-blog.csdnimg.cn/blog_migrate/71f2b7265e3428179404c792bdcf4eb4.png)
除此之外,parse_location()
还具有旧地名修正为新地名、自定义行政区划词典等功能,你可以在其官方文档https://github.com/dongrixinyu/JioNLP/wiki/Gadget-说明文档#地址解析
中了解更多。
本期分享结束,咱们下回见~👋
往期回顾资讯变身「毒」苹果?全球首个DMP漏洞
资讯
程序员化身“侦探”识破AI律所骗局
技术制作数据面板大屏的Python模块
技术10个有趣的Python高级脚本!
分享
点收藏
点点赞
点在看