爬虫应用开发（python课程设计Ⅰ）

最新推荐文章于 2024-07-18 12:06:32 发布

1090218603

最新推荐文章于 2024-07-18 12:06:32 发布

阅读量2.3k

点赞数 1

文章标签：爬虫

本文链接：https://blog.csdn.net/u013597069/article/details/118418202

版权

本文介绍了基于Scrapy爬虫框架抓取腾讯招聘网站的招聘信息，详细讨论了网络爬虫的原理和类型，以及Scrapy的工作流程。通过建立模型和实现爬虫，成功获取并存储了职位名称、地点、类别等数据。在数据爬取过程中，作者克服了动态加载、数据库兼容性等问题，实现了数据的MySQL存储，并进行了初步的查询分析。

摘要由CSDN通过智能技术生成

近些年来，随着人类社会的进步，互联网行业快速发展，社会的信息量不断地累计,呈现爆炸式增长，可以说大数据时代已经全面到来。同时，网络招聘作为企业招聘人才的一种重要方式，相对于流程繁琐，耗费大量时间，沟通渠道狭窄的线下招聘，网络招聘成本低，灵活性、针对性强，资源充足，覆盖面较广，通常是当代高校学生在求职时需要密切关注的信息来源。随着网络招聘规模的增长，大量招聘网站出现，而这些网站中包含的招聘信息也为研究者提供了大量的数据。在信息浩如烟海的大数据时代，如何高效获取万维网上所需的信息，是抢占先机的关键。本文基于Scrapy的框架及工作原理展开论述，使用Scrapy定向爬取腾讯招聘网站当中的相关招聘信息数据，对所爬取的招聘信息数据进行处理分析，分析结果可为毕业生就业前招聘信息提供参考。

本文选取了腾讯招聘作为招聘数据采集的网站，总体抓取了不同地区的不同职位的分布情况，不同岗位的职位要求以及岗位招聘的截止日期和申请网址。通过对不同岗位的数据进行分析，可以清晰的了解公司对不同岗位的具体要求，能够为求职者提供一个比较客观的参考标准，可以帮助求职者比较直观的了解当前该公司对人才需求的标准。