大创项目——Scrapy爬取新浪高考成绩

最新推荐文章于 2022-06-28 11:58:24 发布

dreamiond

最新推荐文章于 2022-06-28 11:58:24 发布

阅读量521

点赞数

分类专栏：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dreamiond/article/details/105519952

版权

背景

记得那是去年秋天，我背着我心爱的小书包在校园里走着，突然接到老师的电话。 “研究生院大创项目开始了，咱们实验室也要报一个，负责人就决定是你了。一会我给你发几个表格你填一下交上去。”

我心想说“另请高明吧”。但是老师讲已经决定了。我就念了两句诗“-------，-------。” 后来我明白了。项目负责人的意思就是说，这个项目只有你一个人来做。老师说“咱们要做一个智能金融预测系统，但是还没想好怎么做。这不最近高考吗，你先做个高考志愿推荐练练手。” 于是就有了这个先导工作——收集高考分数线信息。具体而言，是要从新浪高考爬取高考信息，存储到数据库中供后续项目操作。数据包括：

院校名称
考生所在地
考生类别批次
年份
最高分
平均分

源码存储于我的GITHUB。

在此感谢新浪高考。本爬虫遵守了新浪robots协议。

环境说明

操作系统：windows10 语言：Python3.6.5 爬虫框架：Scrapy 数据库：MongoDB 4.0.10 Community 插件：pymongo

创建Scrapy项目

首先安装Scrapy，不会安装的话参考安装指南。

打开命令行，进入到存放代码的目录。

C:\Users\dreamiond>d:

D:\>cd AllMyCode\Python\

创建Scrapy项目，运行下列命令。

scrapy startproject ScoreCrawler

细节可参考Scrapy入门教程。

观察网页结构

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
大创项目——Scrapy爬取新浪高考成绩

背景记得那是去年秋天，我背着我心爱的小书包在校园里走着，突然接到老师的电话。 “研究生院大创项目开始了，咱们实验室也要报一个，负责人就决定是你了。一会我给你发几个表格你填一下交上去。”我心想说“另请高明吧”。但是老师讲已经决定了。我就念了两句诗“-------，-------。” 后来我明白了。项目负责人的意思就是说，这个项目只有你一个人来做。老师说“咱们要做一个智能金融预测系统，但是还...
复制链接

扫一扫

专栏目录

dreamiond CSDN认证博客专家 CSDN认证企业博客

码龄10年

25: 原创

18万+: 周排名

138万+: 总排名

12万+: 访问

: 等级

1311: 积分

27: 粉丝

138: 获赞

25: 评论

258: 收藏

私信

关注

热门文章

分类专栏

数据库 1篇
分布式 1篇
Linux 1篇
Hadoop 2篇
爬虫 1篇
Unity3D 2篇
微机原理
OpenGL 1篇
C++ 12篇
算法 5篇

最新评论

C++——unordered_set默认无法哈希vector？
ustc_cat: 那得多慢啊...每次都要重构vector
基础算法题——两种遍历方式可以唯一确定一棵二叉树吗？
学c不成反被++: 树的存储告诉我们值相同的节点是可以区分的。这几种遍历都是针对于各个节点的，而不是各个节点的值，在文中这两棵树中，每一个1结点都不相同。试想，如果一棵树的节点值全为1，那任何遍历序列都为1111111...11，照文中的说法，岂不是无论如何都不能确定了？
C++——unordered_set默认无法哈希vector？
DDSSzyq99: 法二怎么变回
C++——自定义map的value默认值
蔷薇尖的风: 对，只要是map这个关联式容器，你插入key之后，没有给value赋值，那么操作符[]会自动调用int()为value赋值。
C++——unordered_set默认无法哈希vector？
luooooooooooooo: 非常傲娇

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。