Python 爬虫,scrapy,settings配置文件

 

项目名/settings.py(配置文件):

# -*- coding: utf-8 -*-

BOT_NAME = '项目名'  # 项目名


SPIDER_MODULES = ['项目名.spiders']  # 爬虫模块的位置
NEWSPIDER_MODULE = '项目名.spiders'

# 定义常量 (数据库地址)。 可以在代码中通过spider对象获取,也可以直接导入使用
MONGO_HOST = "localhost"

LOG_LEVEL = "WARNING"  # 设置日志等级。 默认debug级别
LOG_FILE = "./log.log"  # 设置日志保存位置

USER_AGENT = 'xxx'  # 设置请求头,模拟浏览器

# 服从 robots.txt 协议
ROBOTSTXT_OBEY = False

# 最大并发请求数 (默认16)
# CONCURRENT_REQUESTS = 32

# 从同一网站下载连续页面之前应等待的时间 (默认0)。 可用于限制爬取速度
# DOWNLOAD_DELAY = 3
# 下面两个配置项 配合DOWNLOAD_DELAY使用
# CONCURRENT_REQUESTS_PER_DOMAIN = 16  # 同一个域名的最大并发请求数
# CONCURRENT_REQUESTS_PER_IP = 16   # 同一个IP的最大并发请求数

# 禁用cookie (默认开启cookie)
# COOKIES_ENABLED = False
# COOKIES_DEBUG = True  # 开启cookie的调试信息

# 禁用 Telnet Console (默认开启)
# TELNETCONSOLE_ENABLED = F
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值