[MGeo应用]使用Python+AI模型比较地址相似度

Geo地址匠

已于 2023-02-09 12:09:25 修改

阅读量1.4k

点赞数 2

分类专栏： MGeo应用文章标签： python 人工智能深度学习

于 2023-02-03 10:37:32 首次发布

本文链接：https://blog.csdn.net/GeoDiZhiJiang/article/details/128862338

版权

作者：Geo地址匠（转载请注明出处）

在处理人员登记信息或者收货地址管理时，总会遇到一个麻烦的问题，就是相同的地址存在各种不同的写法。

例如“紫萱路363号人力社保局”经常被简写成“紫萱路363号市人社局”。

基于规则的方法难以覆盖各种个性化的写法，例如“人力社保局”同样可以被省略成“社保局”。

另外，同一个路名路号下也可能同时有多个不同的POI，而某些情况则会省略掉路号，如“紫萱路市人社局”，因此不能简单地根据路名路号来判断。

而使用AI模型，则可以很方便的比较两条地址是否描述同一个地方。

我们开源了一个地址AI预训练底座以及一系列下游应用模型MGeo（ModelScope 魔搭社区），可以用来识别地址里面的省市区。

首先需要安装python3.7的环境，没有anaconda的可以直接下载安装python3.7：

conda create -n py37testmaas python=3.7
conda activate py37testmaas

安装相关依赖：

# cpu机器
pip install cryptography==3.4.8  tensorflow==1.15.5  torch==1.11.0 torchvision==0.12.0 torchaudio==0.11.0 openpyxl

# gpu机器
pip install cryptography==3.4.8  tensorflow-gpu==1.15.5  torch==1.11.0 torchvision==0.12.0 torchaudio

最低0.47元/天解锁文章

Geo地址匠

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
[MGeo应用]使用Python+AI模型比较地址相似度

在处理人员登记信息或者收货地址管理时，总会遇到一个麻烦的问题，就是相同的地址存在各种不同的写法。基于规则的方法难以覆盖各种个性化的写法，例如“人力社保局”同样可以被省略成“社保局”。可以看到这个模型能够正确判断这两条地址是“完全匹配”（exact_match）的。接下来便是读取excel内容，计算两条地址之间的相似度，最后保存结果。而使用AI模型，则可以很方便的比较两条地址是否描述同一个地方。作者：Geo地址匠（转载请注明出处）
复制链接

扫一扫