Google 以前都是分析HTML,使得我们有各种方法生成html,让爬虫得到用户看不到的内容。
在2年之前,google 采用 类似htmlunit 的技术来分析网页,就是渲染html的结果,再进行分析。
这几天发现,这个很酷。
看来,我们也需要改变策略了!
Google 以前都是分析HTML,使得我们有各种方法生成html,让爬虫得到用户看不到的内容。
在2年之前,google 采用 类似htmlunit 的技术来分析网页,就是渲染html的结果,再进行分析。
这几天发现,这个很酷。
看来,我们也需要改变策略了!