python爬虫——scrapy+mysql存储数据

最新推荐文章于 2024-09-25 16:13:12 发布

柿子镭

最新推荐文章于 2024-09-25 16:13:12 发布

阅读量1.4k

点赞数 1

分类专栏： python爬虫文章标签： mysql 爬虫 python scrapy

本文链接：https://blog.csdn.net/weixin_45890771/article/details/122839011

版权

python爬虫专栏收录该内容

22 篇文章 5 订阅

订阅专栏

本文探讨了如何将爬取到的数据同时存储到本地文件和数据库（如MySQL）的操作。首先介绍了使用Mysql的基本步骤，包括创建数据库、表和插入数据。接着，展示了如何在pipeline.py中设计管道类，确保数据按顺序被存储到目标平台。重点在于处理item的流程和如何通过process_item函数进行数据传递。

摘要由CSDN通过智能技术生成

将爬取到的数据一份存储到本地一份存储到数据库，如何实现？

管道文件中一个管道类对应的是将数据存储到一种平台

爬虫文件提交的item只会给管道文件中第一个被执行的管道类接收

process_item 中 return item 表示将item传递给下一个即将被执行的管道类

数据库Mysql操作（创建表并添加数据）：

启动mysql：net start mysql

进入mysql：mysql -u root -p

创建数据库： create database xxx(表名称);

查看数据库：show databases;

创建表： user xxx(数据库名称);

create table xxx(表名称) (

id int not null auto_increment primary key,(设置id为自增长)

title varchar(255) not null,

content varchar(255) not null);

插入数据：insert into xxx(表名称) (title,content) values (xxx,xxx);