cpca模块介绍:
该模块原本的功能是在地址字符串解析出省、市、县。如:输入字符串 ”徐汇区虹漕路461号58号楼5楼“,cpca可以给你输出:|省 |市 |区 |地址 |adcode |
|上海市|市辖区|徐汇区|虹漕路461号58号楼5楼 |310104 |
模块transform函数的说明图:
仔细看了看__init__.py文件中的代码发现它的实现原理是根据adcode这个码来实现的。这个东西在Lib\site-packages\cpca\resources\adcodes.csv这个csv文件,不过原本的adcode是12位,代码里只用到了前六位。每两位代表地理等级,从左往右依次是省、市、区。(注意:每个地理等级最后一个字符不能为0,因为后面处理是依据adcode结尾有多少个0来判断省、市、区)国家个数为百位数,所有判断国家需要占位3个位置,而最后一位不能为0,所以国家从可以从101或者111开始,我这里是从111开始,如中国的adcode为111000000000000
图:
地理坐标我这里全部是空,因为目前用不到,如果需要用到地理坐标的,可以自己生成这个csv的时候给添加上。
这个是修改后的输出内容:
输入:首尔市永登浦区汝矣公演路13
结果:
由于我这边adcodes.csv文件中首尔不是首尔市,所以市在地址里,永登浦区也没有加入到区
202000000为韩国
以后打算将这个完善,做成api接口
下载链接:链接:https://pan.baidu.com/s/1seNM99-PR5OHM76eCbHNRg
提取码:n98h
–来自百度网盘超级会员V4的分享