将scrapy爬取数据保存到mysql数据库和mongodb数据库

最新推荐文章于 2024-08-02 22:16:19 发布

忌颓废

最新推荐文章于 2024-08-02 22:16:19 发布

阅读量1k

点赞数 3

分类专栏： python爬虫文章标签： mysql mongodb python

本文链接：https://blog.csdn.net/weixin_44947339/article/details/103967010

版权

本文介绍了如何使用Scrapy框架爬取NBA网站的首页要闻，并分别将数据保存到MySQL和MongoDB数据库。通过分析网页结构，创建item和spider，配置item pipelines，实现了数据的抓取与存储。在Navicat和Robo 3T中可查看成功保存的数据。注意使用前需安装pymysql和pymongo库，MySQL需预先创建数据库和表。

摘要由CSDN通过智能技术生成

前言
编写scrapy框架软件：pycharm
mysql图形界面工具：navicat
mongodb图形界面工具：Robo 3T
浏览器：Google谷歌
爬取网站：https://china.nba.com/
安装pymysql：在命令行：pip install pymysql
安装pymongo：在命令行：pip install pymongo

一、分析网站
我们将爬取NBA网站的首页的要闻（如图背景为蓝色）
在这里插入图片描述
查看源代码并分析

在谷歌浏览器可以选中我们爬取的内容右键copy–copy xpath （不过我喜欢用css选择器）

二、编写爬虫

1、编写item

class MysqlItem(scrapy.Item):
    # define the fields for your item here like:
    news = scrapy.Field()
    url = scrapy.Field()
    pass

2、编写spider

import scrapy
from mysql.items import MysqlItem
class SqlSpider(scrapy.Spider):
    name = 'sql'
    allowed_domains = ['nba.com']
    start_urls =

最低0.47元/天解锁文章

忌颓废

关注

3
点赞
踩
25

收藏

觉得还不错? 一键收藏
0
评论
将scrapy爬取数据保存到mysql数据库和mongodb数据库

前言编写scrapy框架软件：pycharmmysql图形界面工具：navicatmongodb图形界面工具：Robo 3T浏览器：Google谷歌爬取网站：https://china.nba.com/安装pymysql：在命令行：pip install pymysql安装pymongo：在命令行：pip install pymongo一、分析网站我们将爬取NBA网站的首页的要闻...
复制链接

扫一扫

专栏目录