关于反爬虫: 参考 关于反爬虫,看这一篇就够了 segmentfault 反爬虫技术方案 SCDN 反爬虫手段: 分析请求头Headers分析用户行为ajax异步加载方式加载内容验证码 访问统计IP访问统计Session访问统计User-AgentCookie限制 Cookie校验和Headers的区别在于,用户发送的Headers的内容形式是固定的可以被轻易伪造的,Cookie则不然。 Noscript selenium+phantomJS可跳过大多反爬虫策略