前不久需要一批手机数据做测试,所以就爬取了ZOL上关于手机的各项参数,现在把代码分享出来,希望大家能够多提改进意见。
ZOL手机信息
想要抓取ZOL关于手机的信息需要三个步骤:
手机商城列表页 —》单个手机详情页 ----》当前手机更多详情页面
爬虫代码
# -*- coding: gbk -*-
from scrapy.spiders import CrawlSpider
import scrapy
from urllib.parse import urljoin
class PhoneSpider(CrawlSpider):
name = "phone"
allowed_domains = ["detail.zol.com.cn"]
def start_requests(self):
for i in range(30):
yield scrapy.Request('http://detail.zol.com.cn/cell_phone_index/subcate57_list_' + str(i + 1) + '.html',
self.parse,
dont_filter=True)
def parse(self, response): # 手机商城列表页
phone_plane = response.css('div.pic-mode-box')
phone_