js中怎么去除html标记,js去掉html标记,中正则表达式,去掉字符,截取字符

1,得到网页上的链接地址:

string matchString = @"]+href=\s*(?:'(?[^']+)'|""(?[^""]+)""|(?[^>\s]+))\s*[^>]*>";

2,得到网页的标题:

string matchString = @"

(?.*)";

3,去掉网页中的所有的html标记:

string temp = Regex.Replace(html, "]*>", "");  //html是一个要去除html标记的文档

java 中去掉网页中的所有标签str = str.replaceAll("]*>", "");

4, string matchString = @"

([\S\s\t]*?)";

5,js去掉所有html标记的函数:

function delHtmlTag(str)

{

return str.replace(//g,"");//去掉所有的html标记

}

这个可能IE5会错,那用这个,梅花的:

function delHtmlTag(str)

{

return str.replace(/]+>/g,"");//去掉所有的html标记

}

document方法:

getElementById(id)  返回指定结点的引用

getElementsByTagName(name)  返回文档中所有匹配的元素的集合

createElement(name)  创建指定类型的新结点

createTextNode(text)  创建一个纯文本结点

element方法:

getAttribute(id)  返回指定属性的值

setAttribute(id,value)  给属性赋值

removeAttribute(id)  移除指定属性和它的值

getElementsByTagName(name)  返回结点内所有匹配的元素的集合

node方法:

appendChild(child)  给指定结点添加一个新的子结点

removeChild(child)  移除指定结点的子结点

replaceChild(newChild,oldChild)  替换指定结点的子结点

insertBefore(newChild,refChild)  在同一层级的结点前面插入新结点

hasChildNodes()  如果结点有子结点则返回true

node属性:

nodeName  以字符串的格式存放结点的名称

nodeType  以整型数据格式存放结点的类型

nodeValue  以可用的格式存放结点的值

parentNode  指向结点的父结点的引用

childNodes  指向子结点的引用的集合

firstChild  指向子结点结合中的第一个子结点的引用

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值