参考地址:去除HTML、Word标签的一切样式,获得纯文本 - yar2001
function strip_html(html) { //获得纯文本 var tmp = document.createElement("DIV"); tmp.innerHTML = html; var html = tmp.textContent || tmp.innerText; html = html.replace(/(?:(\r\n)+|\r+|\n+)/g, "<br>"); return html; }
我在此基础上,添加了一个.replace(/<!--.+?-->/g, "")。
function toText(html){
var tmp = document.createElement("DIV");
tmp.innerHTML = html;
var html = tmp.textContent || tmp.innerText;
html = html.replace(/(?:(\r\n)+|\r+|\n+)/g, "<br>");
html = html.replace(/<!--.+?-->/g, "")
return html;
}