爬取虎扑NBA球员常规赛各项数据存储至MongoDB

最新推荐文章于 2024-07-28 20:52:46 发布

binarywz

最新推荐文章于 2024-07-28 20:52:46 发布

阅读量2.2k

点赞数 1

分类专栏： Python 爬虫数据库文章标签： mongodb 数据存储正则表达式数据

本文链接：https://blog.csdn.net/Qaz_wz/article/details/71159783

版权

本文讲述了作者利用requests库和正则表达式爬取虎扑网站上的NBA球员常规赛数据，并将数据存储到MongoDB的过程。内容包括确定爬取的数据项、解析页面结构、遍历多页数据以及代码实现和运行结果的展示。作者期待与读者交流学习。

摘要由CSDN通过智能技术生成

平时喜欢看球赛，十几年的詹密，五一放假（表示五一十天假期）在家闲着没事爬爬本赛季NBA球员常规赛数据。虎扑还是比较友好，页面比较简单，使用requests库和正则表达式就可以完成爬取了，哈哈。

首先看看要爬取哪些数据

这里写图片描述

找到数据在哪些标签里面

这里写图片描述

查看一共收录了几页的球员数据

这里写图片描述

代码

#spider程序
import re
import requests
from requests.exceptions import RequestException
from config import *
import pymongo

client = pymongo.MongoClient(MONGO_URL)
db = client[MONGO_DB]

#获取页面上html代码

最低0.47元/天解锁文章

binarywz

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
爬取虎扑NBA球员常规赛各项数据存储至MongoDB

博主平时没事喜欢看球赛，十几年的詹密，五一放假（五一表示十天假期）在家闲着没事爬爬本赛季NBA球员常规赛数据。虎扑还是比较友好，页面比较简单，使用requests库和正则表达式就可以完成爬取了，哈哈。首先看看要爬取哪些数据找到数据在哪些标签里面查看一共收录了几页的球员数据代码#spider程序import reimport requestsfrom requests.exceptions im
复制链接

扫一扫

专栏目录