cpca简介
一个用于提取简体中文字符串中省,市和区并能够进行映射,检验和简单绘图的python模块。
安装
首先安装 pip install cpca
注:cpca是chinese province city area的缩写
- 本模块中最主要的方法是cpca.transform,该方法可以输入任意的可迭代类型(如list,pandas的Series类型等),然后将其转换为一个DataFrame。
具体代码如下:
data = pd.read_csv(".csv")
integrity_place = cpca.transform(data['企业名称'])
data['省份'] = integrity_place['省']
groups = data.groupby("省份")
writer = pd.ExcelWriter('output.xlsx')
for name, group in groups:
group.to_excel(writer, sheet_name=name, index=False)
writer.save()
绘图
首先安装 pip install folium
运行代码如下:
from cpca import drawer
#df为上一段代码输出的df
drawer.draw_locations(df[cpca._ADCODE], "df.html")
[Github地址 ]https://github.com/DQinYuan/chinese_province_city_area_mapper