浏览器解析html时的一种容错处理方案

以下这种情况下:

<p>aaaa<font>bbb<p>ccc</p>ddd</font>eee</p> 

浏览器会"分断"<p>标签,变成:

<p>aaaa<font>bbb</font></p><p><font>ccc</font></p><font>ddd</font>eee<p></p>

 

分断方法是在html形成dom树的时候,

p标签以及内容已经被添加到dom tree 中后(此时没有做容错处理),

再处理p节点下的子元素,形成分断效果(该移动的元素移动,该新建的元素新建(比如上例中多出来的font元素))(容错处理)。

处理完后,继续解析后面的内容.

这是第一个层次的容错处理。(同样适合于table中的元素分断)

 

在这个容错层次的基础上,然后是有固定格式的元素的处理,比如table元素。

还是按照一般解析的方法得到table的dom tree,

然后提取其中的不必要元素到table的父节点,留下符合table规范的元素。(容错处理)

转载于:https://www.cnblogs.com/cymheart/archive/2012/05/16/2505588.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值