源码分享-HTML文档解析---GoLang实现

本文介绍了如何使用GoLang实现对HTML文档进行递归解析,支持无结束符标签如`base`,`link`,`meta`等,同时处理注释、大小写敏感性、script元素的特殊规则以及修复部分标签错误,如p元素不能包含块级元素等。
摘要由CSDN通过智能技术生成
  • 通过递归方式解析html文档
  • 支持无结束符的标签,"base", "link", "meta", "hr", "br", "wbr", "img", "embed", "param", "source", "track", "area", "col", "input", "keygen", "menuitem",如<meta content="on" http-equiv="x-dns-prefetch-control">
  • 支持注释和声明
  • 忽略标签大小写
  • script 元素没有子元素
  • p 元素不能包含块级元素divp
  • li 元素不能包含li元素
  • 支持修复部分把起始标签写成结束标签的错误

源码见HTML文档解析—GoLang实现

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值