#可配置爬虫 1.爬虫的启动停止(os.system) 2.爬虫基本爬取数据的设置(起始网页,解析规则,停止条件等) 3.爬虫的进度指示 4.爬虫的数据存储 #增量爬虫 1.怎么知道爬取过的网页发生了改变 #分布式爬虫 #反爬虫