word自动消除html标签,如何从word内容中删除html标签?

我知道有一个关于它的几个线程它说简单地使用如何从word内容中删除html标签?

Regex.Replace(input, "<.>", String.Empty);

,但我不能在写在Word文档文本中使用它。 我的代码是这样的:

Microsoft.Office.Interop.Word.Document wBelge = oWord.Documents.Add(ref oMissing,

ref oMissing, ref oMissing, ref oMissing);

Microsoft.Office.Interop.Word.Paragraph paragraf2;

paragraf2 = wBelge.Paragraphs.Add(ref oMissing);

paragraf2.Range.Text ="some long text";

我可以查找和替换样改变

Word.Find findObject = oWord.Selection.Find;

findObject.ClearFormatting();

findObject.Text = "";

findObject.Replacement.Text = "";

findObject.Replacement.ClearFormatting();

object replaceAllc = Word.WdReplace.wdReplaceAll;

findObject.Execute(ref oMissing, ref oMissing, ref oMissing, ref oMissing, ref oMissing,

ref oMissing, ref oMissing, ref oMissing, ref oMissing, ref oMissing,

ref replaceAllc, ref oMissing, ref oMissing, ref oMissing, ref oMissing);

我需要为每一个HTML标记做到这一点?

2014-06-29

ruqo

+0

如果正则表达式失败(我不明白它为什么会失败,你能说明你是如何使用它的?),你可以创建一个所有标签的列表,并使用for循环删除所有标签。 –

+0

@Transcendent,他正在处理一个Word.Document对象,而不是纯文本字符串... –

+0

@elgonzo:是的,但这些段落可以转换为基本字符串,然后正则表达式的作品!我不是吗? –

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值