从富文本中提取内容

1、提取文字内容,没能成功排除,但暂时记一个方法;

function getWordfromrch(html){
	return html.replace(/<(p|div)[^>]*>(<br\/?>|&nbsp;)<\/\1>/gi, '\n').replace(/<br\/?>/gi, '\n')
	.replace(/<[^>/]+>/g, '').replace(/(\n)?<\/([^>]+)>/g, '').replace(/\u00a0/g, ' ').replace(/&nbsp;/g, ' ')
	.replace(/<img[^>]+src\\s*=\\s*['\"]([^'\"]+)['\"][^>]*>/g, '');
}

内容摘自:ueditor.all.js,中的关于:getPlainTxt;(正则表达式不是主项,暂时未能精通);
为了解决模块,建议在保存文档内容时,顺手保存一个:getContentTxt(如果你用的是ueditor);

2、提取图片
在网上找了很多方法,都不是太直接,又比较复杂,有很多人提议用正则,但本人正则真麻麻,所以。。。。
最后想了个办法,把提取出来的文本视作一个dom,然后进行Jquery的提取,结果可行;

$.each($(ue.getContent()).find("img"), function(i,imx) {
	console.log($(imx).attr('src'));
});
成功的把图片的src获取出来,然后作业截图内容呈现即可;
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值