前言
数据我们爬取得到了,参考文章:《子沐课堂——Scrapy之智联招聘篇(一)》,并且我们已经合理的保存到了Mysql数据库中了,参考文章:《子沐课堂——Scrapy之Mysql数据存储》,接下来,我们就需要对数据进行分析,从而获取到Python就业前景如何。
环境和配置
pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。
pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。
Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。
通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。
图表展示
代码
图表结果
通过图表我们发现高薪出现在0-50范围的前半部分,我们点击左下角第五个按钮,放大一下0-50区域的数据
放大后的图表
由图我们可以发现,范围是在0-10之间,存在高峰值,我们再次放大数据。
如此我们得出地点标识为5和10的地点存在高薪,我们查询数据表,可以得到这两个地点,如图所示。
类似如上的分析,还可以做很多,这里就不详细介绍分析了。
相关资料,请加群获取:586656942