- 正则表达式,js去掉html标记,去掉字符,截取字符
- 关键字: js
- 1,得到网页上的链接地址:
- string matchString = @"<a[^>]+href=\s*(?:'(?<href>[^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>";
- 2,得到网页的标题:
- string matchString = @"<title>(?<title>.*)</title>";
- 3,去掉网页中的所有的html标记:
- string temp = Regex.Replace(html, "<[^>]*>", ""); //html是一个要去除html标记的文档
- java 中去掉网页中的所有标签
- str = str.replaceAll("<[^>]*>", "");
- 4, string matchString = @"<title>([\S\s\t]*?)</title>";
- 5,js去掉所有html标记的函数:
- function delHtmlTag(str)
- {
- return str.replace(/<\/?.+?>/g,"");//去掉所有的html标记
- }
- 这个可能IE5会错,那用这个,梅花的:
- function delHtmlTag(str)
- {
- return str.replace(/<[^>]+>/g,"");//去掉所有的html标记
- }
- document方法:
- getElementById(id) 返回指定结点的引用
- getElementsByTagName(name) 返回文档中所有匹配的元素的集合
- createElement(name) 创建指定类型的新结点
- createTextNode(text) 创建一个纯文本结点
- element方法:
- getAttribute(id) 返回指定属性的值
- setAttribute(id,value) 给属性赋值
- removeAttribute(id) 移除指定属性和它的值
- getElementsByTagName(name) 返回结点内所有匹配的元素的集合
- node方法:
- appendChild(child) 给指定结点添加一个新的子结点
- removeChild(child) 移除指定结点的子结点
- replaceChild(newChild,oldChild) 替换指定结点的子结点
- insertBefore(newChild,refChild) 在同一层级的结点前面插入新结点
- hasChildNodes() 如果结点有子结点则返回true
- node属性:
- nodeName 以字符串的格式存放结点的名称
- nodeType 以整型数据格式存放结点的类型
- nodeValue 以可用的格式存放结点的值
- parentNode 指向结点的父结点的引用
- childNodes 指向子结点的引用的集合
- firstChild 指向子结点结合中的第一个子结点的引用
- lastChild 指向子结点结合中的最后一个子结点的引用
正则表达式,js去掉html标记,去掉字符,截取字符
最新推荐文章于 2024-08-06 22:26:26 发布