scrapy简单应用
import scrapy
class ZhihuSpider(scrapy.Spider):
# 爬虫名字,名字唯一,允许自定义
name = ‘zhihu’
# 允许爬取的域名,scrapy每次发起的url爬取数据,先回进行域名检测,检测通过就爬取
allowed_domains = [‘zhihu.com’]
#发起的起始url地址,scrapy项目启动自动调用start_request()...
原创
2019-06-06 15:24:40 ·
1520 阅读 ·
0 评论