页面扒下来的段落不够规范,文字中隔一段会有不等数量的换行符,需要进行修改
1、newscontent = newscontent.replace(/<br(\s+)?\/?>(\s+)?/gi, '<br />');
将前后包括标签内空格的br替换成无空格br
2、 newscontent = newscontent.replace(/(<br\s?\/?>)+/gi, '$1$1');
$1替换成一个空格,$$1替换成连个空格
$1是正则中替换子元素
页面扒下来的段落不够规范,文字中隔一段会有不等数量的换行符,需要进行修改
1、newscontent = newscontent.replace(/<br(\s+)?\/?>(\s+)?/gi, '<br />');
将前后包括标签内空格的br替换成无空格br
2、 newscontent = newscontent.replace(/(<br\s?\/?>)+/gi, '$1$1');
$1替换成一个空格,$$1替换成连个空格
$1是正则中替换子元素