html用于匹配正则的属性,javascript

使用文档解析器和DOM方法获取内容,而不是正则表达式。 正则表达式绝对是这项工作的错误工具。 即使您可以获得正则表达式,也很难理解并且非常脆弱。 随后的解决方案更加健壮,更易于理解和易于调试。

首先创建一个解析器并解析文档片段:

var parser = new DOMParser();

var doc = parser.parseFromString(

'Some ContentSome Other Content',

"text/html");

您可以通过检查doc.documentElement看到结果,这将为我们提供:

Some Content

Some Other Content

由于您的标签未正确关闭,因此解析起来很奇怪,但这并不重要。 文本内容仍然是内容。

var walker = doc.createTreeWalker(

doc.documentElement, // root

NodeFilter.SHOW_TEXT, // what to show

null, // filter

false); // reference expansion

然后,我们可以走树并收集所有走过的节点:

var node;

var textNodes = [];

while (node = walker.nextNode()) {

textNodes.push(node);

}

最后,我们得到所需的数组:

var content = textNodes.map(x => x.textContent);

Content是一个包含["Some Content", "Some Other Content"] ,即所需结果集的数组。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值