“
阅读本文大概需要 2 分钟。
”我们来看一个网页,大家想想使用 XPath 怎么抓取。
可以看到,在源代码里面没有请抓取我!
这段文字。难道这个网页是异步加载?我们现在来看一下网页的请求:
网页也没有发起任何的Ajax 请求。那么,这段文字是从哪里来的?
我们来看一下这个网页对应的 HTML:
整个 HTML 里面,甚至连 JavaScript 都没有。