python-docx的安装和使用
1. 安装python-docx
python install python-docx
返回如下界面表示安装成功
2. 基本功能使用
导包:from docx import Document
tmp文件可以用excel打开,打开后选择ASC码或者utf-8
# 创建文档对象
document = Document(r'C:\Users\WM\Desktop\syntophone\python\python-docx/判断题.docx')
# 读取文档中所有的段落列表
ps = document.paragraphs
# 每个段落有两个属性:style和text
ps_detail = [(x.text, x.style.name) for x in ps]
with open('out.tmp', 'w+', encoding='utf-8') as fout:
fout.write('')
# 读取段落并写入一个文件
典型文件内容处理
1)文件处理中常用到python内置re包,因为re搜索支持正则表达式
2)re.search(查找字符串,被查找内容) # 返回结果为True/False
re.sub(被替换字符串,替换字符串,内容) # 返回替换后结果
4)下方代码为从技能鉴定题库中提取出选择题题干