scrapy爬虫储存到mysql_Scrapy爬虫数据存入到MySql数据库

最新推荐文章于 2022-07-06 19:21:58 发布

雷幺幺

最新推荐文章于 2022-07-06 19:21:58 发布

阅读量321

点赞数

文章标签： scrapy爬虫储存到mysql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_30063287/article/details/113294955

版权

本文介绍如何使用Scrapy爬虫将抓取的数据存储到MySQL数据库中，详细讲解了设置pipelines和配置数据库连接的过程，包括SQL插入语句的编写，并在Settings.py中添加数据库配置。

摘要由CSDN通过智能技术生成

主要是两个文件~

pipelines

from twisted.enterprise import adbapi

import pymysql

class Www0577HomePipeline(object):

def __init__(self,mysql_config):

self.dbpool = adbapi.ConnectionPool(

mysql_config['DRIVER'],

host=mysql_config['HOST'],

port=mysql_config['PORT'],

user=mysql_config['USER'],

password=mysql_config['PASSWORD'],

db=mysql_config['DATABASE'],

charset='utf8'

)

@classmethod

def from_crawler(cls,crawler):

# 只要重写了from_crawler方法，那么以后创建对象的时候，就会调用这个方法来获取pipline对象

mysql_config = crawler.settings['MYSQL_CONFIG']

return cls(mysql_config)

def process_item(self, item, spider):

result = self.dbpool.runInteraction(self.insert_item,item)

result.addErrback(self.insert_error)

return item

#SQL语句~

def insert_item(self,cursor,item):

sql = "insert into data(id,name,address,sell_address,price,type,developer,telephone,years,time_dev,time_ok,link) values(null,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s)"

args = (item['name'],item['address'],item['sell_address'],item['price'],item['type'],item['developer'],item['telephone'],item['years'],item['time_dev'],item['time_ok'],item['link'])

cursor.execute(sql,args)

def insert_error(self,failure):

print("="*30)

print(failure)

print("="*30)

def close_spider(self,spider):

self.dbpool.close()

Settings.py文件需要添加数据库信息

MYSQL_CONFIG = {

'DRIVER': "pymysql",

'HOST': "127.0.0.1",

'PORT': 3306, # port必须为整形

'USER': 'root',

'PASSWORD': 'root',

'DATABASE': "XXXX"

}

天勤 , 版权所有丨如未注明 , 均为原创丨本网站采用BY-NC-SA协议进行授权

转载请注明原文链接：Scrapy爬虫数据存入到MySql数据库

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。