scrapy框架爬取小说入库

 http://www.cnblogs.com/GUIDAO/p/6690759.html

本人步骤:

1>setting.py:

BOT_NAME = 'newding'  SPIDER_MODULES = ['newding.spiders'] NEWSPIDER_MODULE = 'newding.spiders'
ROBOTSTXT_OBEY = True

  ITEM_PIPELINES = { 'newding.pipelines.NewdingPipeline': 300, }

以上配置;创建项目会自动出现这些

以下是想要入数据库的(阶段):

MYSQL_USER = 'root' MYSQL_PASSWORD = '12345678' MYSQL_HOST = '127.0.0.1' MYSQL_PORT = '3306' MYSQL_DB = 'xiaoshuo'
2>RUN.py
from scrapy.cmdline import execute execute(['scrapy', 'crawl', 'newding1s']) #执行项目命令
3>items.py
import scrapy
class NewdingItem(scrapy.Item):
# define the fields for your item here like:
# name = scrapy.Field()
# pass
title = scrapy.Field()
types = scrapy.Field()
zijie = scrapy.Field()
book_url = scrapy.Field()

转载于:https://www.cnblogs.com/qq1141/p/7098513.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值