在document.createTreeWalker()中过滤(2)

在上面,我定义了一个自定义函数“myfilter()”来过滤掉(内部)文档中的所有DIV和IMG。 这样的函数接受一个参数,当前被指向的节点作为Tree Walker遍历文档。 在此函数中,支持3个常量,以允许您接受,拒绝或跳过节点:

NodeFilter过滤函数常量
NodeFilter.FILTER_ACCEPT NodeFilter.FILTER_REJECT NodeFilter.FILTER_SKIP

FILTER_ACCEPT是自解释的,当返回时通知TreeWalker接受此节点。 但是,FILTER_REJECT和FILTER_SKIP以微妙的方式不同,这对于理解很重要。 使用FILTER_REJECT TreeWalker将拒绝相关节点以及节点的任何后代,而使用FILTER_REJECT时,TreeWalker将跳过相关节点但不跳过其后代。 换句话说,如果您希望过滤掉与父节点无关的节点,请使用NodeFilter.FILTER_SKIP而不是NodeFilter.FILTER_REJECT。 考虑上面的相同过滤器功能,但略微修改为使用“REJECT”而不是“SKIP”来取消不需要的节点:

1
2
3
4
6
<font style= "vertical-align: inherit;" ><font style= "vertical-align: inherit;" >myfilter =函数(节点){</font></font><font></font><font style= "vertical-align: inherit;" ><font style= "vertical-align: inherit;" >
if (node.tagName ==“DIV”|| node.tagName ==“IMG”) //过滤掉DIV和IMG元素</font></font><font></font><font style="vertical-align: inherit;"><font style="vertical-align: inherit;">
返回NodeFilter.FILTER_ACCEPT</font></font><font></font><font style= "vertical-align: inherit;" ><font style= "vertical-align: inherit;" >
其他</font></font><font></font><font style= "vertical-align: inherit;" ><font style= "vertical-align: inherit;" >
返回NodeFilter.FILTER_REJECT</font></font><font></font><font style= "vertical-align: inherit;" ><font style= "vertical-align: inherit;" >
}</font></font>

在这种情况下,并非文档中的所有DIV和IMG元素都可以被提取! 这是因为图像可能包含在被拒绝的元素(如<P>)中,导致TreeWalker在遇到不需要的P元素时自动跳过它。


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/69933200/viewspace-2652504/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/69933200/viewspace-2652504/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值