一、scrapy:
1、创建项目
scrapy startproject myproject #myproject 为项目名
2、列出所有模板
scrapy genspider -l
3、创建爬虫
scrapy genspider -t crawl zhihu zhihu.com # zhihu 为爬虫名 zhihu.com为爬取网站域名
scrapy genspider spiders zhihu.com # spiders为爬虫名 zhihu.com为爬取网站域名
4、运行spider
scrapy crawl spidername # 输出日志加源代码
scrapy crawl spidername --nolog # 只输出源代码