爬虫数据保存到数据库通用格式--------pipelines.py 下载管道

最新推荐文章于 2022-09-25 15:00:17 发布

cats_miao

最新推荐文章于 2022-09-25 15:00:17 发布

阅读量466

点赞数

分类专栏： python爬虫 python进阶文章标签： python

本文链接：https://blog.csdn.net/cats_miao/article/details/80400492

版权

python进阶同时被 2 个专栏收录

19 篇文章 0 订阅

订阅专栏

python爬虫

11 篇文章 0 订阅

订阅专栏

import pymysql


class MysqlPipeline(object):
    def __init__(self):
        self.conn = None
        self.cur = None

    def open_spider(self, spider):
        self.conn = pymysql.connect(
            host='127.0.0.1',
            port=3306,
            user='root',
            password='root',
            db='xpc1704',
            charset='utf8mb4'
        )
        self.cur = self.conn.cursor()

    def process_item(self, item, spider):
        if not hasattr(item, 'table_name'):
            return item
        cols, values = zip(*item.items())
        sql = "INSERT INTO `%s` (%s) VALUES (%s)" % \
              (
                  item.table_name,
                  ','.join(cols),
                  ','.join(['%s'] * len(values))
               )
        # sql = "INSERT INTO `{}` ({}) VALUES ({})" % \
        #                 "ON DUPLTCATE KEY {}".format(
        #                 item.table_name,
        #                 ','.join(cols),
        #                 ','.join(['%s'] * len(values)),
        #                 ','.join(['`{}`=%s'.format(k) for k in cols])
        #                     )
        print(sql, values)
        self.cur.execute(sql, values)
        self.conn.commit()
        # print(self.cur._last_executed)
        return item

    def close_spider(self, spider):
        self.cur.close()
        self.conn.close()

cats_miao

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
爬虫数据保存到数据库通用格式--------pipelines.py 下载管道

import pymysqlclass MysqlPipeline(object): def __init__(self): self.conn = None self.cur = None def open_spider(self, spider): self.conn = pymysql.connect( ...
复制链接

扫一扫

专栏目录