作者:Geo地址匠(转载请注明出处)
在处理人员登记信息或者收货地址管理时,总会遇到一个麻烦的问题,就是相同的地址存在各种不同的写法。
例如“紫萱路363号人力社保局”经常被简写成“紫萱路363号市人社局”。
基于规则的方法难以覆盖各种个性化的写法,例如“人力社保局”同样可以被省略成“社保局”。
另外,同一个路名路号下也可能同时有多个不同的POI,而某些情况则会省略掉路号,如“紫萱路市人社局”,因此不能简单地根据路名路号来判断。
而使用AI模型,则可以很方便的比较两条地址是否描述同一个地方。
我们开源了一个地址AI预训练底座以及一系列下游应用模型MGeo(ModelScope 魔搭社区),可以用来识别地址里面的省市区。
首先需要安装python3.7的环境,没有anaconda的可以直接下载安装python3.7:
conda create -n py37testmaas python=3.7
conda activate py37testmaas
安装相关依赖:
# cpu机器
pip install cryptography==3.4.8 tensorflow==1.15.5 torch==1.11.0 torchvision==0.12.0 torchaudio==0.11.0 openpyxl
# gpu机器
pip install cryptography==3.4.8 tensorflow-gpu==1.15.5 torch==1.11.0 torchvision==0.12.0 torchaudio