基于python对北上广深的程序员薪资进行分析,绘制相关图形

目录

 

绪论

正文

编写爬虫,已经获得了结构化的数据如图所示

利用pandas读入数据,进行数据处理,分析出4个城市共8个数据源的工资信息,并利用pyecharts生成柱形图。

用python的第三方包wordcloud生成词云

基于matplotlib的工资分布直方图

总结


绪论

随着我国经济与社会的快速发展.,科技的进步以及计算机的普及。程序员成为一个备受人们关注的群体,随着近年全国互联网创业热潮的兴起,"互联网+"、"云计算""人工智能"以及"区块链"等领域发展迅速,市场对程序员的需求更为旺盛。作为即将走下社会,步入工作岗位的我们,了解目前程序员的薪资现状,岗位职责就显得尤为重要,本文即将通过分析51job网站的程序员招聘信息,得出相关结论

正文

编写爬虫,已经获得了结构化的数据如图所示

利用pandas读入数据,进行数据处理,分析出4个城市共8个数据源的工资信息,并利用pyecharts生成柱形图。

根据数据源大小就可得知,java程序员的招聘需求要远远高于python程序员,几乎高出10倍以上。工资的最大值java四个城市均高于python,同时平均值除北京外,也是Java程序员最高,由此可见,Java程序员的就业前景相当广阔,基本不愁找不到工作,在同一个城市,招聘需求就达到了千次。而python作为一门后起之秀的脚本语言,虽然照Java有一定的差距,但是python的优点在于入门快,没有编程基础的人也能够轻松掌握,随着python的进步,现在已经有了机器学习,人工智能,大数据分析等多种就业方向,相信学python一定不会太差

用python的第三方包wordcloud生成词云

根据数据源可知,已经爬取了相关岗位职责信息,现在要根据这些信息,生成词云,从而更准确的分析去程序员岗位职责的要求的权重。

分析词云由于第一次没有做数据预处理,导致分析结果如图所示

信息均为一些无效信息,无法反映出招聘现状,通过用python自带的字符串处理函数,将诸如“开发经验”“熟练使用”“以上”词语去除后,再次进行词频分析如图所示(图为上海java数据源生成的词云)

从图中不难看出,本科学历已经变成了JAVA程序员的最基础的敲门砖,想要得到月入上万的收入,掌握基本的开源框架,拥有良好的团队合作能力,精通一门语言,分析用户需求,掌握oracle mysql等数据库就已经成立必须的技能

本图为上海python程序员岗位信息词云图。反映出了程序员的重要技能,首先,虽然大家说不要靠学历找工作,但是现在学历还是第一位。机器学习、django框架哦在python中十分重要,这些都是对程序员知识储备的要求,同时程序员处理工作的软实力也很重要,比如团队合作能力和良好的沟通能力,以及合作精神。这些都是一个团队良好运作的基本要求。还要求程序员有良好的学习能力,社会在不断进步。工作挑战不断出新,这就要求程序员不断学习深造,得到更好的工作机会。

基于matplotlib的工资分布直方图

绘制工资分布直方图,matplotlib优于pyecharts的地方在不需要进行词频统计,只要传入工资列表,设置组距即可,最后生成如图

根据各市工资分布区间来看,程序员工资分布基本都在10000-15000之间,尤其广州程序员工资明显高于其他市区,我们再来看工资的整体分布饼图。也说明了这一点

总结

根据以上可以看出,程序员的薪资水平还是很高的,各位码农们,加油干吧 ,如果想要python源码欢迎在下面评论或者私信我。

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
Python是一种强大的编程语言,具有良好的可读性和易用性,因此在新型网络架构性能分析方面也有广泛的应用。以下是基于python对新型网络架构进行性能分析的一些常用工具和技术: 1. Mininet:Mininet是一种网络仿真工具,可用于构建虚拟网络环境,模拟真实网络中的各种情况,如带宽限制、延迟、丢包等。在python中,可以使用Mininet API来创建和管理虚拟网络环境,并进行性能测试和分析。 2. Scapy:Scapy是一种强大的网络数据包处理工具,可用于生成、发送和捕获网络数据包,支持多种协议和格式。在python中,可以使用Scapy库来进行网络流量监测和分析,从而评估网络性能和诊断问题。 3. Pyshark:Pyshark是一种基于Wireshark的网络数据分析工具,可以在python中使用。它提供了一种简单的方式来捕获和分析网络数据包,可用于网络性能测试和问题排查。 4. MatplotlibMatplotlib是一种常用的数据可视化工具,可用于绘制各种图表和图形,如折线图、饼图、散点图等。在python中,可以使用Matplotlib库来将性能测试结果和分析数据可视化,以更直观的方式呈现网络性能情况。 以上是一些常用的基于python的新型网络架构性能分析工具和技术,它们可以帮助我们更方便、快速地对新型网络架构进行性能测试和分析,以便进行网络优化和改进。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值