scrapy pip中间件个人处理

最新推荐文章于 2024-09-22 17:12:26 发布

weixin_34184158

最新推荐文章于 2024-09-22 17:12:26 发布

阅读量151

点赞数

文章标签： python

原文链接：http://www.cnblogs.com/zengxm/p/11094674.html

版权

import pymongo
from scrapy.conf import settings
import pymysql



class Mongodb_Pipeline(object):

    def __init__(self):
        self.client = pymongo.MongoClient()
        self.db = self.client[settings.get('MONGODB_NAME')]

    def process_item(self, item, spider):
        if item:
            coll = item['classification1']
            self.db[coll].insert(dict(item))
        return item


    def close_spider(self):
        self.client.close()