// 去除标签
setText(html) {
return html.replace(/<(p|div)[^>]*>(<br\/?>| )<\/\1>/gi, '\n')
.replace(/<br\/?>/gi, '\n')
.replace(/<[^>/]+>/g, '')
.replace(/(\n)?<\/([^>]+)>/g, '')
.replace(/\u00a0/g, ' ')
.replace(/ /g, ' ')
.replace(/<img[^>]+src\\s*=\\s*['\"]([^'\"]+)['\"][^>]*>/g, '')
.replace(/<\/?(img|table)[^>]*>/g, "") // 去除图片和表格
.replace(/<\/?(a)[^>]*>/g, "") // 去除a标签
},
传入html,返回html
去除标签
原作者
这个函数用于去除HTML中的特定标签,如段落、换行、图片、表格和链接等,将HTML内容转化为纯文本格式,适用于文本处理和解析。
8497

被折叠的 条评论
为什么被折叠?



