如何检索标记内包含的所有
HTML?
hxs = HtmlXPathSelector(response)
element = hxs.select('//span[@class="title"]/')
perhaps = hxs.select('//span[@class="title"]/html()')
html_of_tag = ?
编辑:
如果我查看documentation,我只看到返回新的xpathselectorlist的方法,或者只返回标签内的原始文本.
我想要检索不是新列表或文本,而是检索标记内的源代码HTML.
例如.:
justtext
sometext
sometext
blabla
an awfuly long example for this.
我想做一个像hxs.select(‘// div [@ id =“leexample”] / html()’)这样的方法,它会返回它里面的HTML,如下所示:
justtext
sometext
sometext
我希望我清除了围绕我的问题的模棱两可.
如何从Scrapy中的HtmlXPathSelector获取HTML? (也许解决方案外部scrapy的范围?)