python国家教育部_Python爬虫入门教程 38-100 教育部高校名单数据爬虫 scrapy

最新推荐文章于 2022-05-24 17:23:48 发布

诗太浓

最新推荐文章于 2022-05-24 17:23:48 发布

阅读量518

点赞数

文章标签： python国家教育部

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_32672471/article/details/113509866

版权

爬前叨叨

今天要爬取一下正规大学名单，这些名单是教育部公布具有招生资格的高校名单，除了这些学校以外，其他招生的单位，其所招学生的学籍、发放的毕业证书国家均不予承认，也就是俗称的野鸡大学！

网址是 https://daxue.eol.cn/mingdan.shtml 爬取完毕之后，我们进行一些基本的数据分析，套路如此类似，哈哈

这个小项目采用的是scrapy，关键代码

import scrapy

from scrapy import Request,Selector

class SchoolSpider(scrapy.Spider):

name = 'School'

allowed_domains = ['daxue.eol.cn']

start_urls = ['https://daxue.eol.cn/mingdan.shtml']

def parse(self, response):

select = Selector(response)

links = select.css(".province>a")

for item in links:

name = item.css("::text").extract_first()

link = i

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python国家教育部_Python爬虫入门教程 38-100 教育部高校名单数据爬虫 scrapy

爬前叨叨今天要爬取一下正规大学名单，这些名单是教育部公布具有招生资格的高校名单，除了这些学校以外，其他招生的单位，其所招学生的学籍、发放的毕业证书国家均不予承认，也就是俗称的野鸡大学！网址是 https://daxue.eol.cn/mingdan.shtml 爬取完毕之后，我们进行一些基本的数据分析，套路如此类似，哈哈这个小项目采用的是scrapy，关键代码import scrapyfrom ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。