python爬虫day01
01-爬虫的君子协议
robots文件是一个君子协议,告诉爬虫抓取者,拥有的权限,那些可以抓取那些不可以抓取
示例:http://example.webscraping.com/robots.txt
02-查看网站的规模
可以通过百度或则谷歌查看网站的规模如:
示例:site:www.jd.com
robots文件是一个君子协议,告诉爬虫抓取者,拥有的权限,那些可以抓取那些不可以抓取
示例:http://example.webscraping.com/robots.txt
02-查看网站的规模
可以通过百度或则谷歌查看网站的规模如:
示例:site:www.jd.com