import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
data3 = pd.read_csv(r'lagou_python.csv')
data3.head()
data3.iloc[:,0]
data3.loc[0]
data3.tail()
| positionId | city | companyFullName | companyLabelList | district | education | firstType | formatCreateTime | positionName | salary | workYear |
---|
445 | 6637264 | 上海 | 上海微创软件股份有限公司 | ['绩效奖金', '带薪年假', '定期体检', '弹性工作'] | 闵行区 | 本科 | 开发|测试|运维类 | 2天前发布 | 云计算python开发工程师 | 12k-18k | 3-5年 |
446 | 6287886 | 上海 | 上海晨芽教育科技有限公司 | ['股票期权', '带薪年假', '岗位晋升', '五险一金'] | 浦东新区 | 本科 | 开发|测试|运维类 | 2天前发布 | Python 服务端研发工程师 | 15k-25k | 3-5年 |
447 | 6547051 | 北京 | 北京益投后信息咨询有限公司 | ['绩效奖金', '通讯津贴', '业务餐补', '咖啡补贴'] | 顺义区 | 本科 | 开发|测试|运维类 | 2019-12-02 | python开发 | 40k-60k | 3-5年 |
448 | 6631669 | 上海 | 上海树融数据科技有限公司 | ['股票期权', '弹性工作', '扁平管理', '技能培训'] | 杨浦区 | 本科 | 开发|测试|运维类 | 2天前发布 | 大数据开发工程师(Python) | 15k-29k | 3-5年 |
449 | 6608696 | 长沙 | 湖南智圭谷信息技术咨询服务有限公司 | [] | 雨花区 | 大专 | 开发|测试|运维类 | 2019-11-16 | python实习 | 3k-4k | 不限 |
data3['positionName'].str.lower().value_counts()[:10].plot(kind="barh")
plt.show()
data3['education'].value_counts().plot(kind='barh')
plt.show()
data3['workYear'].value_counts().plot(kind='barh')
plt.show()
data3['salary'].value_counts()[:30].plot(kind='barh')
plt.show()
data3['city'].value_counts()[:10].plot(kind='pie',autopct='%1.2f%%')
plt.show()
data3['workYear'].value_counts()[:10].plot(kind='pie',autopct='%1.2f%%')
plt.show()