python读取word文件并替换部分文字_python实现替换word中的关键文字(使用通配符)...

环境:Python3.6

本文主要是通过win32com操作word,对word中进行常用的操作。本文以替换为例,讲解一下如何使用Python在word中使用“通配符模式”(类似于正则表达式)替换文本内容。

#!/usr/bin/env python

# -*- coding:utf-8 -*-

import os

import win32com

from win32com.client import Dispatch

# 处理Word文档的类

class RemoteWord:

def __init__(self, filename=None):

self.xlApp = win32com.client.Dispatch('Word.Application') # 此处使用的是Dispatch,原文中使用的DispatchEx会报错

self.xlApp.Visible = 0 # 后台运行,不显示

self.xlApp.DisplayAlerts = 0 #不警告

if filename:

self.filename = filename

if os.path.exists(self.filename):

self.doc = self.xlApp.Documents.Open(filename)

else:

self.doc = self.xlApp.Documents.Add() # 创建新的文档

self.doc.SaveAs(filename)

else:

self.doc = self.xlApp.Documents.Add()

self.filename = ''

def add_doc_end(self, string):

'''在文档末尾添加内容'''

rangee = self.doc.Range()

rangee.InsertAfter('\n' + string)

def add_doc_start(self, string):

'''在文档开头添加内容'''

rangee = self.doc.Range(0, 0)

rangee.InsertBefore(string + '\n')

def insert_doc(self, insertPos, string):

'''在文档insertPos位置添加内容'''

rangee = self.doc.Range(0, insertPos)

if (insertPos == 0):

rangee.InsertAfter(string)

else:

rangee.InsertAfter('\n' + string)

def replace_doc(self, string, new_string):

'''替换文字'''

self.xlApp.Selection.Find.ClearFormatting()

self.xlApp.Selection.Find.Replacement.ClearFormatting()

#(string--搜索文本,

# True--区分大小写,

# True--完全匹配的单词,并非单词中的部分(全字匹配),

# True--使用通配符,

# True--同音,

# True--查找单词的各种形式,

# True--向文档尾部搜索,

# 1,

# True--带格式的文本,

# new_string--替换文本,

# 2--替换个数(全部替换)

self.xlApp.Selection.Find.Execute(string, False, False, False, False, False, True, 1, True, new_string, 2)

def replace_docs(self, string, new_string):

'''采用通配符匹配替换'''

self.xlApp.Selection.Find.ClearFormatting()

self.xlApp.Selection.Find.Replacement.ClearFormatting()

self.xlApp.Selection.Find.Execute(string, False, False, True, False, False, False, 1, False, new_string, 2)

def save(self):

'''保存文档'''

self.doc.Save()

def save_as(self, filename):

'''文档另存为'''

self.doc.SaveAs(filename)

def close(self):

'''保存文件、关闭文件'''

self.save()

self.xlApp.Documents.Close()

self.xlApp.Quit()

if __name__ == '__main__':

# path = 'E:\\XXX.docx'

path = 'E:/XXX.docx'

doc = RemoteWord(path) # 初始化一个doc对象

# 这里演示替换内容,其他功能自己按照上面类的功能按需使用

doc.replace_doc(' ', '') # 替换文本内容

doc.replace_doc('.', '.') # 替换.为.

doc.replace_doc('\n', '') # 去除空行

doc.replace_doc('o','0') # 替换o为0

# doc.replace_docs('([0-9])@[、,,]([0-9])@', '\1.\2') 使用@不能识别改用{1,},\需要使用反斜杠转义

doc.replace_docs('([0-9]){1,}[、,,.]([0-9]){1,}', '\\1.\\2') # 将数字中间的,,、.替换成.

doc.replace_docs('([0-9]){1,}[旧]([0-9]){1,}', '\\101\\2') # 将数字中间的“旧”替换成“01”

doc.close()

以上这篇python实现替换word中的关键文字(使用通配符)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值