1 robots协议介绍 爬虫引发的问题 性能骚扰 法律风险 隐私泄漏 爬虫限制机制 来源审查:判断User‐Agent进行限制 发布公告:Robots协议 Robots协议 Robots Exclusion Standard,网络爬虫排除标准,放在网站根目录下的robots.txt文件,告知网络爬虫哪些页面可以抓取,哪些不行