爬虫在爬取数据时,要遵守robot协议。 查看robot协议的方法就是: 网站首页有效URL + /robots.txt 以CSDN为例: https://www.csdn.net/robots.txt