jsoup和w3c的dom解析问题记录

1.jsoup和w3c都有纠错功能。

比如<head>ff</head>

他们在解析时候根本不会把ff解析进dom

2.

<head alt="d233"> 

<a alt="d233">ddeeee</a>

</head>


他们会把这解析成head有3个子节点 换行也算。

jsoup的 children函数可以直接得到一个element节点、


3.

<a>ee</a>

<a1>ee</a1>

w3c gettextcontext输出文本都输出ee

jsoup:调用text()输出都是ee。

但是:

jsoup:调用tostring和outhtml时候

a标签会输出<a>ee</a>

但是a1自定义标签 会输出

<a1>

ee

</a1>

会多出换行。


4.


<a>ee</a>

<a1>ee</a1>

jsoup得到文本节点

node=getelementBytagname("a").get(0).childnode(0)。

输出:

ee。

node=getelementBytagname("a1").get(0).childnode(0)。

输出:


ee。

多了换行。




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值