html,XPath 学习笔记

原创 2016年05月31日 02:54:09

XPath

1. 

Chrome和傲游浏览器的Console中执行的Xpath代码有些区别。

例如,要提取a tag中的某个属性,在傲游中是这样写:

$x('//a/@href')

而在Chrome中则是

$x('//a')[0].getAttribute('href')


2:// 和 /

在XPath中,双斜线 "//" 表示收集在Hierarchy中任意位置的某类型的元素。比如 “//a” 就表示此文件中的所有 a tag。

而单斜线 "/" 则表示属于某一个tag下一级的tag,比如 "//div/p" 就表示直接位于所有div下一级的p tag。


3:*

用 '*' 来选择某一层下的所有元素.

例:$x('//div/*')


4:select tags with consitions

$x('//a[@href]') # a tags with href attribute

$x('//a[@href="http://www.iana.org/domains/example"]') # a tags whose href is as above

$x('//a[contains(@href, "iana")]') # a tags whose href contains "iana"

$x('//a[starts-with(@href, "http://www.")]') # a tags whose href start with "http://www."

$x('//a[not(contains(@href, "abc"))]') # a tags whose href do not contain "abc"

5 更多XPath命令请见

http://www.w3schools.com/xsl/xsl_functions.asp



6 在网页源码处右键Copy XPath其实是个非常实用的办法。




使用 XPath 解析 HTML 文档

原文 http://funhacks.net/2016/05/08/使用XPath解析HTML文档/ XPath 的全称是 XML Path Language,即 XML 路径语言,它是一种在结...
  • miracletiger
  • miracletiger
  • 2016年12月03日 14:28
  • 4571

xpath在HTML解析中的应用(加强版)

经过一番研究以后才发现原来libxml2其实已经内置了对HTML的解析——即使是不很规范的HTML。所以上篇《xpath在XHTML解析中的应用》完全是我学艺不精的产物。囧不过好处是顺便学习到了j7a...
  • Raptor
  • Raptor
  • 2009年09月03日 17:52
  • 20934

html标签及xpath处理相关方法

收藏一个很有用的html tag替换的工具类,可用作替换,清楚字符串中的html标签     ///     /// 字符串处理类     ///     public class StrHelp...
  • huwei2003
  • huwei2003
  • 2014年12月29日 10:49
  • 2381

根据xpath获得html元素text

使用lxml库可以解析xpath,用BeautifulSoup不可以:Code Example (Python 3):from lxml import etree import iohtml = "Y...
  • qq_16912257
  • qq_16912257
  • 2016年11月24日 17:39
  • 661

Java下使用xpath解析html文件

这段时间一直在网络上扒取数据,为了方便就用到了xpath,一开始使用真的是挺难的,不过用用就好了,但是网上的资源少之又少,所以自己就写个博客把~~~ 首先需要下载三个jar包  nekohtml.ja...
  • taozuihen17
  • taozuihen17
  • 2013年12月30日 21:11
  • 5967

python 使用xpath解析html

python 使用xpath解析html
  • xm_csdn
  • xm_csdn
  • 2017年03月21日 17:16
  • 891

XPath 获取两个node中间的HTML Nodes

//div[@id="Recipe"]//h5[contains(text(),"Ingredients")]/following-sibling::p[count(.|//div[@id="Reci...
  • lglgsy456
  • lglgsy456
  • 2015年06月01日 16:42
  • 1918

怎么利用xpath解析html数据

去年的时候一直想做一些东西,但是因为服务器自己不会搭建,
  • u011337275
  • u011337275
  • 2014年05月05日 10:25
  • 2584

html根据Xpath取得内容的java实现

最近再写一个android音乐播放器应用,因为需要获得歌手的头像图片,在没有找到合适的获取歌手信息API的情况下,打算直接用百度百科中的歌手头像来实现。这里也就是利用Xpath来获取歌手图片的链接地址...
  • chenrulong
  • chenrulong
  • 2015年05月10日 14:48
  • 2163

HTML解析:基于XPath的C#类库HtmlAgiliytyPack

最近处于毕业设计开始阶段,前期工作需要去国外的一些专业数据库网站比对一些所需TF家族信息,为了快捷方便,想到用程序去帮助实现。前期实现了一系列的尝试,使用C#的的网络编程类库,获取查询结果,但是为了分...
  • u010487568
  • u010487568
  • 2013年11月11日 17:00
  • 4631
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:html,XPath 学习笔记
举报原因:
原因补充:

(最多只允许输入30个字)