基于python爬虫与数据分析系统设计

百度网盘下载地址(957):点击下载

本文使用Python编写爬虫,通过向端口传送请求并且抓取传输过来的json字符串来获取招聘职位信息,并且分类保存为csv格式的表格文件。最后通过长时间的爬取,最终得到37.7MB的表格数据,共计314093个招聘信息。之后通过SPSS对数据进行预处理和统计,再进行深度数据分析。

【关键词】: 拉勾网 招聘信息 爬虫 数据挖掘 数据分析 Python SPSS

使用Python编写爬虫,通过向端口传送请求并且抓取传输过来的json字符串来获取招聘职位信息,
并且分类保存为csv格式的表格文件。最后通过长时间的爬取,最终得到37.7MB的表格数据,共计314093
个招聘信息。之后通过SPSS对数据进行预处理和统计,再进行深度数据分析。

./csvs  --爬去的数据文件
./data  --爬去的数据文件
./报告  --说明ppt和word(仔细阅读,写论文用)
./处理  --spss软件数据图表分析处理
./代码  --各分类py爬取代码和核心lago2.py代码(最终)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值