明确目标:利用pandas对数据进行查询操作,并利用pyecharts对地理位置可视化,有些地理位置在地理库中不存在,如雄安新区等,需要我们添加地理位置。
我们仍然使用招聘数据:数据地址
import pandas as pd
import numpy as np
data = pd.read_excel('数据挖掘.xlsx',header = None)
df = pd.DataFrame(data)
df.index = df.index.set_names(['key'])
df.columns = ['website','position','company','location','low','high','type','education','experience']
df.head()
输出结果:
website | position | company | location | low | high | type | education | experience | |
---|---|---|---|---|---|---|---|---|---|
key | |||||||||
0 | https://jobs.51job.com/hangzhou-bjq/112861375.... | 商品主管/经理 | 浙江迪欧达实业有限公司 | 杭州 | 7.0 | 10.0 | 民营公司 | 大专 | 3-4年经验 |
1 | https://jobs.51job.com/wuhan/95235653.html?s=0.. |