作者:Geo地址匠(转载请注明出处)
在处理人员登记信息或者收货地址管理时,常常需要把地址里的省市区镇拆分出来方便后续分类管理。
例如对于地址“上海市静安区乌鲁木齐中路12号”,单独拆分出“上海市/静安区”。
目前一些基于规则的方法无法覆盖到所有情况,比如:
- 通过“xx省”“xx市”后缀来找省市区的,当缺少该后缀便无法工作。例如:上海静安华山医院,按照后缀是找不到上海和静安的。
- 通过字符长度来切割的,例如设置省的长度为3,当遇到长度不同的省市区名称变会出错。例如:内蒙古自治区,按照长度切割,内蒙古会被识别为省,自治区会被识别为市。
我们开源了一个地址AI预训练底座以及一系列下游应用模型MGeo(ModelScope 魔搭社区),可以用来识别地址里面的省市区。
首先需要安装python3.7的环境,没有anaconda的可以直接下载安装python3.7:
conda create