一行代码实现Python提取省、市、县信息!

库的安装与简介

在日常数据处理中,如果你需要从一个完整的地址中提取出省、市、县三级地名,或者乡镇、村、社区两级详细地名,你可以使用一个第三方库来实现快速解析。在使用之前,你需要先安装这个库。

pip install jionlp -i https://pypi.douban.com/simple/

为了更快速地安装,我们可以选择使用国内的软件源(比如豆瓣镜像)进行下载和安装所需的第三方库。当然,你也可以选择其他可靠的国内源进行操作。

库的使用

安装并导入该库后,就可以进行使用了。

import jionlp as jio

Ⅰ基础省市信息的提取

只要你提供一个完整的地址,我们就能从中提取出省、市、区的信息。

text = '四川省成都市武侯区红牌楼街19号红星大厦9楼2号'
res = jio.parse_location(text)
print(res)

1bc5f9b67ea8187e74881c7a7bf0ba7e.png


Ⅱ 自动补全省市信息

如果提供的地址信息不完整,缺少省市的信息,我们仍然可以通过上述方法实现地址的自动补全,并正确提取出省市的信息。

text = '武侯区红牌楼街道19号红星大厦9楼2号'
res = jio.parse_location(text)
res

a2a8df46aed86a0fb463e789f462a5a9.png


Ⅲ 街镇乡、村或居委会信息提取

通过将参数设置为True,我们可以实现这个需求,即自动补全地址信息并提取出乡镇和村庄级别的详细地名。

text = '江苏省南通市崇川区陈桥街道33号'
res = jio.parse_location(text,town_village=True)
res

543f2a269957f4c3e91537b1bc0d4d04.png


Ⅳ 自动将旧地名映射为新地名

如果国内的行政区划发生了变动,我们可以通过设置change2new参数为True来自动将旧地名转换为新地名。这个功能仅限于省、市、县三级行政区划的转换。

举个例子,2020年国务院批准,港闸区更名为崇川区。

text = '港闸区陈桥街道33号'
res = jio.parse_location(text, change2new=True, town_village=True)  
res

6ab46e2ad580741765797e5006ceaef6.png

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值