scrapy框架爬虫案例——竞彩网NBA受注

最新推荐文章于 2024-05-19 17:08:23 发布

京海第一深情xin

最新推荐文章于 2024-05-19 17:08:23 发布

阅读量744

点赞数 5

分类专栏：数据挖掘实验文章标签： scrapy 爬虫 mysql python json database

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_56699753/article/details/138219258

版权

检查网页源代码

首先分析网址的数据请求：

进入到新URL：

可发现是json数据格式（需要导入json）

import scrapy
import json
from scrapy import Request
from scrapy.http import TextResponse

items的使用

在items.py文件中，添加代码

import scrapy
class BaskStation(scrapy.Item):
    no_str = scrapy.Field()
    league = scrapy.Field()
    datetime = scrapy.Field()
    home = scrapy.Field()
    away = scrapy.Field()
    a_sf = scrapy.Field()
    h_sf = scrapy.Field()
    battle = scrapy.Field()
    a_rate = scrapy.Field()
    h_rate = scrapy.Field()
    a_ds = scrapy.Field()
    h_ds = scrapy.Field()

使用json提取元素

name = "bask_station"  # 爬虫名称
allowed_domains = ["webapi.sporttery.cn"]
start_urls = ["https://webapi.sporttery.cn/gateway/jc/basketball/getMatchListV1.qry"]
custom_settings = {
    "ITEM_PIPELINES": {
        "lottery_crawls.pipelines.pipelines_game.BaskStationPipeline": 300,
     },
    "DOWNLOADER_MIDDLEWARES": {
        "lottery_crawls.middlewares.LotteryCrawlsDownloaderMiddleware": 300,
     }
}

当爬取其他页时，URL地址会改变，如果不在allowed_domains中，就不能爬取，所以要修改allowed_domains中的URL地址

def start_requests(self):
    yield Request(
        url=f"https://webapi.sporttery.cn/gateway/jc/basketball/getMatchListV1.qry?clientCode=3001&leagueId=1"
    )

可以根据自己的需要重写此方法，来实现起始请求的其他功能或者加入头部信息或者是其他参数等等

def parse(self, response: TextResponse, **kwargs):
    date_group = json.loads(response.text)["value&#

最低0.47元/天解锁文章

京海第一深情xin

博客等级

码龄4年

53
原创

429
点赞

649
收藏

300
粉丝

关注

私信

热门文章

分类专栏

最新评论

2024南京邮电大学上机复试：现场编程（第一场）B. 扫雷分析器
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
2024南京邮电大学上机复试：现场编程（第二场）A. 数字游戏
普通网友: 这篇文章是优质之作，内容充实，结构明晰，语言流畅且通俗易懂，适合广大读者阅读。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
操作系统实验(三)——安师大
CSDN-Ada助手: 恭喜您完成第16篇博客，标题为“操作系统实验(三)——安师大”。非常高兴看到您持续创作并分享关于操作系统实验的经验。在这篇博客中，您对安师大的操作系统实验进行了介绍，给读者提供了有用的信息。接下来，我建议您可以考虑分享一些实验中遇到的挑战以及如何克服它们的经验。这样的内容将进一步丰富您的博客，并帮助读者更好地应对类似的问题。谦虚地说，我期待着您未来的创作。加油！
操作系统实验——银行家算法(附C语言代码)
CSDN-Ada助手: 恭喜您写了第17篇博客！标题中提到了操作系统实验中的银行家算法，我对此非常感兴趣。您的博客内容一定很有深度和实用性。不过，如果可能的话，我希望您能够在博客中加入更多的实例和案例，以帮助读者更好地理解银行家算法的应用场景和效果。期待您下一步的创作，希望您能继续分享更多有关操作系统实验的经验和知识。谦虚地说，我相信您的博客将会对广大读者产生积极的影响和启发！
操作系统实验(四)——页面置换算法(附C语言代码)
CSDN-Ada助手: 非常感谢您的持续创作，阅读了您的博客标题后，我对您的研究和实验深感钦佩。页面置换算法是操作系统中一个十分重要的话题，您的C语言代码也给了我很大的启发。希望您能继续分享更多关于操作系统的实验和算法方面的经验，我相信这将对广大读者有着很大的帮助。如果可能的话，我期待您能给出更多实际应用的示例，并对其中的优缺点进行探讨。谢谢您的分享，期待您下一篇博客的发布！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

京海第一深情xin 你的鼓励将是我创作最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。