库的安装与简介
在日常数据处理中,如果你需要从一个完整的地址中提取出省、市、县三级地名,或者乡镇、村、社区两级详细地名,你可以使用一个第三方库来实现快速解析。在使用之前,你需要先安装这个库。
pip install jionlp -i https://pypi.douban.com/simple/
为了更快速地安装,我们可以选择使用国内的软件源(比如豆瓣镜像)进行下载和安装所需的第三方库。当然,你也可以选择其他可靠的国内源进行操作。
库的使用
安装并导入该库后,就可以进行使用了。
import jionlp as jio
Ⅰ基础省市信息的提取
只要你提供一个完整的地址,我们就能从中提取出省、市、区的信息。
text = '四川省成都市武侯区红牌楼街19号红星大厦9楼2号'
res = jio.parse_location(text)
print(res)
Ⅱ 自动补全省市信息
如果提供的地址信息不完整,缺少省市的信息,我们仍然可以通过上述方法实现地址的自动补全,并正确提取出省市的信息。
text = '武侯区红牌楼街道19号红星大厦9楼2号'
res = jio.parse_location(text)
res
Ⅲ 街镇乡、村或居委会信息提取
通过将参数设置为True,我们可以实现这个需求,即自动补全地址信息并提取出乡镇和村庄级别的详细地名。
text = '江苏省南通市崇川区陈桥街道33号'
res = jio.parse_location(text,town_village=True)
res
Ⅳ 自动将旧地名映射为新地名
如果国内的行政区划发生了变动,我们可以通过设置change2new参数为True来自动将旧地名转换为新地名。这个功能仅限于省、市、县三级行政区划的转换。
举个例子,2020年国务院批准,港闸区更名为崇川区。
text = '港闸区陈桥街道33号'
res = jio.parse_location(text, change2new=True, town_village=True)
res