scrapy框架 获取iframe标签中的数据
本小菜鸟在用scrapy爬取一个网站时,使用浏览器右键copy xpath 时发现,获取不到数据,后面观察我所需的数据是在iframe标签中,但是iframe标签中的数据是不能够直接获取的,因为iframe是HTML里面嵌套HTML的一种框架,下面直接上案例:
我们所需数据为图中a标签中的数据,但是直接用xpath解析获取不到里面的数据
当我们运行xpath时,解析出来的数据为空
造成这个数据为空的因为是iframe是直接嵌套在html页面之中的,而嵌套iframe是指定了src的,所以我们只需要请求src之后的url即可,请求过后我们再次运行程序(还是用原来的xpath):
发现数据不为空