201X届XX学院毕业生就业情况分析
今天拿到了X年XX学院的就业情况表,就想着做个关于就业的统计分析。花了3个小时做整个分析的构思、设计和实现,也算是费尽心思了吧!(里面没有用到任何与个人信息对应的数据,如果有任何侵犯个人隐私的,本人承诺立马删除)。
- 读取文件
import pandas as pd
import matplotlib.pyplot as plt
from pylab import *
file='就业信息.xlsx'
sheetname='附件二'
data=pd.read_excel(file,sheetname,0,1,encoding='utf8')
data=data[['就业单位性质','就业状况','生源地区','实际就业单位','实际所在地']]
data.head(5)
就业单位性质 | 就业状况 | 生源地区 | 实际就业单位 | 实际所在地 | |
---|---|---|---|---|---|
0 | 待就业 | 待就业 | 四川省眉山市 | NaN | NaN |
1 | 其他企业 | 已就业 | 河南省驻马店市 | 成都三零盛安信息系统有限公司 | 四川省成都市 |
2 | 三资企业 | 已就业 | 湖北省天门市 | 京信通信系统(中国)有限公司 | 广东省广州市 |
- 设置图格式和大小
mpl.rcParams['font.sans-serif'] = ['SimHei']
font_size = 11 # 字体大小
fig_size = (8, 6) # 图表大小
# 更新字体大小
mpl.rcParams['font.size'] = font_size
就业状况分析
res=data.gro