xpath xpath以非常底层的实现而闻名于世,大部分源代码是用 C 语言写的。 正则表达式: 尽量避免在html全文本中直接使用 计算机科学里曾经有个笑话:“如果你有一个问题打算用正则表达式( regular expression)来解决,那么就是两个问题了。”