页面扒下来的段落不够规范,文字中隔一段会有不等数量的换行符,需要进行修改 1、newscontent = newscontent.replace(/<br(\s+)?\/?>(\s+)?/gi, '<br />'); 将前后包括标签内空格的br替换成无空格br 2、 newscontent = newscontent.replace(/(<br\s?\/?>)+/gi, '$1$1'); $1替换成一个空格,$$1替换成连个空格 $1是正则中替换子元素