scrapy+mongodb实现爬取的小说入库

MongoDB数据库的下载安装

在官网下载https://www.mongodb.com/download-center/community
在这里插入图片描述
可视化工具Studio 3T下载https://robomongo.org/
创建数据库
在这里插入图片描述
点击New Connection
在这里插入图片描述
创建新的表
在这里插入图片描述

scrapy+mongodb

1、setting.py

DOWNLOADER_MIDDLEWARES = {
    #'Douluodalu.middlewares.DouluodaluDownloaderMiddleware': 543,
    'Douluodalu.middlewares.MyUserAgentMiddleware':543,
}

2、item.py

import scrapy

class DouluodaluItem(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
    title=scrapy.Field() #章节名
    chapter=scrapy.Field() #内容
    pass

3、pipeline.py

import pymongo
  #从settings.py中导入mongodb的配置信息
class DouluodaluPipeline(object):
    def __init__(self):
        #配置mongo
        host='127.0.0.1'#本地地址
        port=27017     #端口
        client=pymongo.MongoClient(host=host,port=port)
        db = client["dldl"]  #数据库名
        self.post = db["douluo1"] #表名
    def process_item(self, item, spider):
        self.post.insert(item)  #插入字典
        return item
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值