应用场景:我们学校搞综测会发放一个压缩包,里面含有各种活动的加分证明,想要快速且不遗漏的找到自己的名字的话,就可以来跑一下这个py啦!
环境:jupyter
要求:事先安装 pip install python-docx
代码修改处:文件存放根目录和要搜索的关键词
#coding=utf-8
from docx import Document
import os,sys
def search_word(filename,word):
#打开文档
document = Document(filename)
#读取每段资料
pa=document.paragraphs
#拼接每一段的内容
para_list = []
for para in pa:
para_list.append(para.text)
#合并字符串
file_text = ''.join(para_list)
if word in file_text:
print("find file for {}:".format(word))
print(filename)
process_list=[]
def get_process_files(root_dir):
"""process all files in directory"""
cur_dir=os.path.abspath(root_dir)
file_list&