- 通过递归方式解析html文档
- 支持无结束符的标签,
"base", "link", "meta", "hr", "br", "wbr", "img", "embed", "param", "source", "track", "area", "col", "input", "keygen", "menuitem"
,如<meta content="on" http-equiv="x-dns-prefetch-control">
- 支持注释和声明
- 忽略标签大小写
script
元素没有子元素p
元素不能包含块级元素div
、p
li
元素不能包含li
元素- 支持修复部分把起始标签写成结束标签的错误
源码分享-HTML文档解析---GoLang实现
于 2023-10-05 22:24:40 首次发布
本文介绍了如何使用GoLang实现对HTML文档进行递归解析,支持无结束符标签如`base`,`link`,`meta`等,同时处理注释、大小写敏感性、script元素的特殊规则以及修复部分标签错误,如p元素不能包含块级元素等。
摘要由CSDN通过智能技术生成