scrapy爬虫演示
来源:哔哩哔哩网站
视频作者: 九九爱你(不是文章本人)
链接:
https://www.bilibili.com/video/BV1mp411o7mw?from=search&seid=14583196262084808268
创建项目
scrapy genspider name(爬虫项目名字) “url”(爬取目标)
使用scrapy genspider 创建爬虫项目,名称和url保存位置
运行爬虫
scrapy crawl name(爬虫名字)
Google xpath插件:爬虫利器
爬取代码
清洗编辑作者信息
引用re包(import re)
结合使用compile()和search()。
清洗效果:
数据不存在,补空值:
作者:Irain
QQ联系方式:2573396010
日期:2020年4月13日