pandas对多种数据具有强大的分析处理功能,现以一个sql招聘数据进行介绍如何进行分析职业分布情况
题目如下:
1.统计不同学历的职位分布
2.统计不同学历下薪资待遇
3.统计python不同就业方向的分布(web,爬虫,数据分析
首先我们连接上sql并创建DataFrame对象
import pandas as pd
import sqlite3
conn = sqlite3.connect("recruit.db")
df = pd.read_sql("select * from recruit",conn)
df.info()
统计不同学历的职位分布
我们先查看学历种类
df['education'].unique()
我们可以看到学历种类比较杂乱,我们将统招本科和本科及以上归于本科,其他含有“招”字的归于其他类:
df.loc[df['education'] == '本科及以上','education'] = '本科'
df.loc[df['education'] == '统招本科','education'] = '本科'
df.loc[df['educ