场景:由于微信小程序播报带html标签的文本段落时会将标签和英文字符播放出来,所以需要提取其中的汉字和数字。
步骤:
- 去掉html中的标签:
var extras = '<p><span style="font-family: 宋体; font-size: 14pt;">7月21日,士大夫深刻的的数据恢复的司法环境的方式 第三方i偶尔文件地方的粉丝附件打扫房间ijfkddsfjsdklfj伺服电机的方式</span></p>'; var gshextras = extras.replace(/<[^>]+>/g,"");
- 剔除英文字母,只保留汉字和数字
var lastExtras = gshextras.replace(/[^\u4e00-\u9fa5_0-9]/gi,""); console.log('正则处理后的内容为:',lastExtras)