XPath
栗子ma
这个作者很懒,什么都没留下…
展开
-
【XPath】语法、Axes、操作符
【原文链接】https://www.w3schools.com/xml/xpath_syntax.asp XPath Syntax XPath uses path expressions to select nodes or node-sets in an XML document. The node is selected by following a path or steps. ...翻译 2018-08-03 15:09:33 · 292 阅读 · 0 评论 -
【爬虫】Scrapy 中利用 XPath 丢弃所有跟 footer 相关的内容
【前言】利用 Scrapy 爬取网站文字的时候发现,footer 中的 Copyright 等文字会影响后续分词的效果,因此决定将网页的 HTML 中有关 footer 的内容都丢弃。以下是不排除 footer 中内容的时候拿到网页的所有文本内容: response.selector.xpath('//*[not(self::script or self::style or self::tit...原创 2018-08-03 16:11:55 · 967 阅读 · 0 评论