Scrapy框架学习 - 使用Twisted框架实现异步存储数据到MySQL数据库中

最新推荐文章于 2024-06-14 14:52:32 发布

「已注销」

最新推荐文章于 2024-06-14 14:52:32 发布

阅读量3.1k

点赞数 1

本文链接：https://blog.csdn.net/topleeyap/article/details/79209816

版权

本文介绍了如何在Scrapy爬虫项目中结合Twisted的adbapi模块，实现异步将豆瓣读书Top250排行榜的数据存储到MySQL数据库，以提高数据存储效率。关键步骤包括创建数据库连接池，使用连接池进行异步数据库操作，并配置错误回调处理。

摘要由CSDN通过智能技术生成

概述

以爬取豆瓣读书Top250排行榜为例。

关键是使用Twisted框架的adbapi，创建数据库连接池对象，然后使用这个数据库连接池对象进行数据库操作，
这样就实现了数据存储的异步方案。

核心代码如下:
1.使用Twisted中的adbapi获取数据库连接池对象。
参数“pymsql”为使用的数据库引擎名字，params与直接使用pymsql.connect(params)连接数据库时相同
self.dbpool=adbapi.ConnectionPool('pymysql',**params)
2.使用数据库连接池对象进行数据库操作,自动传递cursor对象到数据库操作方法的第一个参数，
query=self.dbpool.runInteraction(self.do_insert,item)
也可以设置出错时的回调方法,自动传递出错消息对象failure到错误处理方法的第一个参数
query.addErrback(self.on_error,spider)

代码

items.py

class DoubanbookItem(scrapy.Item):
    # 图书详情页链接
    link=scrapy.Field()
    # 图书名称
    title=scrapy.Field()
    # 作者,出版信息,价格等信息
    info=scrapy.Field()
    # 豆瓣评分
    rating=scrapy.Field()
    # 引论
    quote=scrapy.Field()

spider

# !/usr/bin/env python
# -*- coding:utf-8 -*-

import scrapy
from myscrapy.items import DoubanbookItem

class DoubanbookSpider(scrapy.Spider):

最低0.47元/天解锁文章

「已注销」

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
Scrapy框架学习 - 使用Twisted框架实现异步存储数据到MySQL数据库中

概述以爬取豆瓣读书Top250排行榜为例。关键是使用Twisted框架的adbapi，创建数据库连接池对象，然后使用这个数据库连接池对象进行数据库操作，这样就实现了数据存储的异步方案。核心代码如下: 1.使用Twisted中的adbapi获取数据库连接池对象。参数“pymsql”为使用的数据库引擎名字，params与直接使用pymsql.connect(params)连接数据
复制链接

扫一扫

专栏目录