《2018年8月20日》【连续322天】
标题:继续pyspider;
内容:
1.
提取:
def detail_page(self, response):
return {
"url": response.url,
"title": response.doc('#booktitle').text(),
"data": response.doc('.when .data').text(),
"day": response.doc('.howlong .data').text(),
"who": response.doc('.who .data').text(),
"text": response.doc('#b_panel_schedule').text(),
"image": response.doc('.cover_img').attr.src
}
提取结果:
2.启动爬虫:
设置好后,点击actions的Run:
右边的Tasks可查看请求,Results可查看爬取结果;