Python实现一个全国各高校查询系统

最新推荐文章于 2024-02-24 12:57:48 发布

VIP文章一小小辣椒

最新推荐文章于 2024-02-24 12:57:48 发布

阅读量1.6k

点赞数 2

分类专栏：爬虫 scrapy 数据分析文章标签： python 爬虫 visual studio code

本文链接：https://blog.csdn.net/weixin_40018318/article/details/113925580

版权

想法：整合全国各地高校保存下来，自己随时随地查询各高校官网信息！
资源网站：那些年，我们一起被折磨过的高考
资源提取方式：Scrapy爬虫
保存方式：mysql数据库
scrapy 项目 spider.py 代码：

import scrapy
from scrapy.linkextractors import LinkExtractor
from scrapy.spiders import CrawlSpider, Rule
from university.items import UniversityItem

class SchoolSpider(CrawlSpider):
    name = 'school'
    allowed_domains = ['u.feelingmsg.com']
    start_urls = ['http://u.feelingmsg.com/u/guangdong.php']

    rules = (
        Rule(LinkExtractor(allow=r'http://u.feelingmsg.com/u/(.*?).php'), callback='parse_item', follow=True),
    )

    def parse_item(self, response):
        item = UniversityItem()
        results = response.xpath('/html/body/table[4]//tr')
        for result in results:
            schools = result.xpath('./td')
            for school in schools:
                name = school.xpath('./span/a/text()').get()
                if name:
                    item['city'] = response.xpath

最低0.47元/天解锁文章

一小小辣椒

关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
Python实现一个全国各高校查询系统

想法：整合全国各地高校保存下来，自己随时随地查询各高校官网信息！资源网站：那些年，我们一起被折磨过的高考资源提取方式：Scrapy爬虫保存方式：mysql数据库scrapy 项目 spider.py 代码：import scrapyfrom scrapy.linkextractors import LinkExtractorfrom scrapy.spiders import CrawlSpider, Rulefrom university.items import UniversityIt
复制链接

扫一扫