背景
很多时候,很多人,需要去抓取网页中某些特定内容。
但是,除了之前介绍过的,想要提取某些,静态网页,中的特定内容,比如:
和
之外,有些人会发现,对于其所要抓取网页中的内容,网页源码中却没有。
所以,此时,就不知道如何实现了。
此处,就来解释一下,如何抓取所谓的动态网页中的特定内容。
前提知识
在看本文之前,你需要具备相关的基础知识:
1.抓取网页,模拟登陆等相关的逻辑
如果不熟悉,可参考:
2.学会用工具,比如IE9的F12,去抓取对应的网页执行的过程
不熟悉的可参考:
3.对于普通的静态网页,如何提取所需的内容
对此不熟悉的,可以参考:
(1)Python版:
(2)C#版:
什么是动态网页
此处所谓的动态网页,是相对于那些静态网页来说的。
而此处所说的静态网页,指的是,对于通过浏览器中查看网页源码时,看到的网页源码中的内容,和网页显示的内容,都是对应的。
换句话说,我想要获得网页上显示的某个内容时,都是可以通过查找网页源码,而找到对应的部分的。
而动态网页,与此相反,想要获得动态网页中的特定的内容,通过直接查看网页源码,是找不到的。
动