经常使用 Selenium 或者 Puppeteer 的同学都知道,启动的 Chrome 浏览器分为有头模式和无头模式
如果是有头模式,则会弹出一个 Chrome 浏览器窗口,然后你能看到这个浏览器里面在自动操作;而无头模式则不会弹出任何窗口,只有产生一个进程
下面这篇文章中,我们介绍了一个探测模拟浏览器特征的网站
通过他我们可以发现,在不做任何设置的情况下,Selenium 或者 Puppeteer 启动的浏览器有几十个特征能够被目标网站识别为爬虫,并且无头模式的特征比有头模式的特征多得多
也就是说,即使你不使用任何隐藏特征的技术,仅仅使用有头模式,你都会安全很多;如果网站不是非常严格的反爬虫,很多情况下,使用无头模式更容易被发现,但使用有头模式,更难被发现
下图为使用 有头模式,不使用任何隐藏特征的技术访问检测网站:
下图为使用 无头模式,不使用任何隐藏特征的技术访问检测网站: