全国所有大学的数据信息(包括专本科,覆盖全国),一共是获取到了全国31个省份,共2769所大学。
涉及到的内容:
Pandas — 数据处理
Pyecharts — 数据可视化
安装库
pip install pyecharts
1、导入模块
Pandas数据处理
读取数据
import pandas as pd
from collections import Counter
###画图
from pyecharts import options as opts
from pyecharts.charts import Map
from pyecharts.globals import ThemeType
from pyecharts.charts import Bar, Pie, Timeline
from pyecharts.faker import Faker
datafile = u'/home/mw/input/university_data1034/
data = pd.read_excel(datafile)
data.head()
2、不同省份大学数量
###不同省份大学数量
attr = data['省份'].tolist()
result = Counter(attr)
# 排序
d = sorted(result.items(), key=lambda x: x[1], reverse=True)
#print(d)
#for i in d:
# print(i)
provinces = [i[0] for i in d]
value = [i[1] for i in d]
#print(provinces)
#print(value)
c = (
Map()
.add("", [list(z) for z in zip(provinces, value)], "china")
.set_global_opts(
title_opts=opts.TitleOpts(title="分段型数据"),
visualmap_opts=opts.VisualMapOpts(max_=200, split_number=8, is_piecewise=True),
)
)
c.render_notebook()
3、统计省份对应不同市大学数量
##统计省份对应不同市大学数量
###广东所有城市
gd_city = []
###吉林所有城市
jl_city = []
for index, row in data.iterrows():
if row[0]=="广东"