这是我写的 spider 文件,下面有我碰到的在一个页面内所需要的值,放在 3 个 json 文件中。。。。。所以我在一个函数下写了三个 yield Request 请求……
import scrapy
from scrapy.http import Request
import re
from jingdong.items import JingdongItem
from jingdong.settings import *
class GoodsSpider(scrapy.Spider):
name = 'goods'
allowed_domains = ['jd.com']
start_urls = ['http://jd.com/']
# https://search.jd.com/Search?keyword=图书&enc=utf-8&wq=图书&page=1
# 搜索的起始页
url = "https://search.jd.com/Search?keyword={KEYWORDS}&enc=utf-8&wq={KEYWORDS}&page={page}"
# 电子价格
Eprice_url = "https://c.3.cn/book?skuId={skuId}&cat={cat}&area=1_72_2799_0&callback=book_jsonp_callback"
# 商品价格
price_url = "https://p.3.cn/prices/mgets?typ