Python使用总结之py-docx将word文件中的图片保存,并将内容返回
使用py-docx读取word文档的内容,其中包含标题、文本和图片等信息。该方法将标题和内容返回,并将文件中的图片保存到指定的文件夹中。
实现步骤
- 加载文件内容
- 读取文件的段落
- 对文件段落做判断
- 根据判断结果进行数据保存或者文件保存
代码部分
from docx import Document
import os
import re
def extract_images_and_text(doc_path, output_folder):
os.makedirs(