替换后:
代码展示:
'''
word段落文字里的手动换行符变成段落标记
作者:AI对话大师、百度AI对话
时间:2024年3月15日
'''
from docx import Document
from docx.shared import Pt
# 打开 Word 文档
doc = Document(r'C:\Users\jg2yXRZ\OneDrive\桌面\测试word换行符\123.docx')
# 用于保存要删除的段落
paragraphs_to_delete = []
# 遍历文档中的所有段落
for paragraph in list(doc.paragraphs):
# 查找段落中的软回车(\n)
if '\n' in paragraph.text:
# 分割段落文本,找到软回车的位置
texts = paragraph.text.split('\n')
# 首先处理第一个文本块
paragraph.text = texts[0]
# 在软回车的位置插入新的段落
for text in texts[0:]:
new_paragraph = paragraph.insert_paragraph_before(text)
new_paragraph.style = paragraph.style # 保留原始样式
# 将原始段落添加到待删除列表中
paragraphs_to_delete.append(paragraph)
# 删除原来的段落
for paragraph in paragraphs_to_delete:
paragraph._element.getparent().remove(paragraph._element)
doc.save(r'C:\Users\jg2yXRZ\OneDrive\桌面\测试word换行符\234.docx')
通过代码观察:
Python对docx段落