【技术类-03】python实现docx表格文字的“手动换行符(软回车)”变成“段落标记(硬回车)”

作品展示——docx表格内的手动换行符更改硬回车

背景需求:

这篇成功把docx文本段落(无表格)中的“手动换行符(软回车)”变成“段落标记(硬回车)。

【技术类-02】python实现docx段落文字的“手动换行符(软回车)”变成“段落标记(硬回车)”-CSDN博客文章浏览阅读26次。【技术类-02】python实现docx段落文字的“手动换行符(软回车)”变成“段落标记(硬回车)”https://blog.csdn.net/reasonsummer/article/details/136750032

但是我的19篇周计划docx里的所有手动换行符都是在docx表格里

所以我在原有代码基础上,重新生成了——python实现docx表格文字的“手动换行符(软回车)”变成“段落标记(硬回车)”

运行前

代码展示:


'''
了解在Python里docx表格里、段落里分别有几个手动换行符(软回车),有几个段落标记符号(硬回车)
作者:AI 对话大师、百度AI对话
时间:2024年3月16日
'''

from docx import Document

# 表格里的

doc = Document(r'C:\Users\jg2yXRZ\OneDrive\桌面\测试word换行符\123.docx')

# 初始化换行符计数器
soft_newline_count_in_tables = 0
hard_newline_count_in_tables = 0

# 遍历文档中的所有表格
for table in doc.tables:
    for row in table.rows:
        for cell in row.cells:
            # 遍历单元格中的每个段落
            for paragraph in cell.paragraphs:
                # 遍历段落中的每个文本运行
                for run in paragraph.runs:
                    # 统计文本运行中软回车(换行符)的数量
                    soft_newline_count_in_tables += run.text.count("\n")
                
                # 段落结束,增加一个硬回车的计数(包括表格单元格中的段落)
                hard_newline_count_in_tables += 1

# 打印统计结果
print(f"Word 文档中表格内共有 {soft_newline_count_in_tables} 个 '\\n' 手动换行符(软回车)。")
print(f"Word 文档中表格内共有 {hard_newline_count_in_tables} 个 <w:p> 段落标记(硬回车)。")


# 段落里的
# 初始化换行符计数器
newline_count = 0
p_count = 0

# 遍历文档中的每个段落,统计换行符数量
for paragraph in doc.paragraphs:
    for run in paragraph.runs:
        # 统计每个文本运行中换行符的数量
        newline_count += run.text.count("\n")
    if paragraph._element is not None and paragraph._element.tag.endswith('p'):
        p_count += 1
  
print(f"Word 文档中段落内共有 {newline_count} 个 '\ n' 手动换行符(软回车)。")
print(f"Word 文档中段落内共有 {p_count} 个 <w:p> 段落标记(硬回车)。")


'''
word表格文字和段落里里的手动换行符变成段落标记 (docx表格)
作者:AI对话大师、百度AI对话
时间:2024年3月15日
'''
from docx import Document
from docx.shared import Pt

# 打开 Word 文档
doc = Document(r'C:\Users\jg2yXRZ\OneDrive\桌面\测试word换行符\123.docx')

# 用于保存要删除的单元格
cells_to_delete = []
# 用于保存要删除的段落
paragraphs_to_delete = []

# 遍历文档中的所有表格
for table in doc.tables:
    for row in table.rows:
        for cell in row.cells:
            # 查找单元格中的软回车(\n)
            if '\n' in cell.text:
                # 分割单元格文本,找到软回车的位置
                texts = cell.text.split('\n')

                # 清空原始单元格文本
                cell.text = texts[0]

                # 在软回车的位置插入新的段落
                for text in texts[1:]:
                    new_paragraph = cell.add_paragraph(text)
                    new_paragraph.style = cell.paragraphs[0].style  # 保留原始样式

# 删除原来的单元格文本中的软回车
for cell in cells_to_delete:
    cell.text = cell.text.replace('\n', '')


# 遍历文档中的所有段落
for paragraph in list(doc.paragraphs):  
    # 查找段落中的软回车(\n)
    if '\n' in paragraph.text:
        # 分割段落文本,找到软回车的位置
        texts = paragraph.text.split('\n')
        
        # 首先处理第一个文本块
        paragraph.text = texts[0]
        
        # 在软回车的位置插入新的段落
        for text in texts[0:]:
            new_paragraph = paragraph.insert_paragraph_before(text)
            new_paragraph.style = paragraph.style  # 保留原始样式
        
        # 将原始段落添加到待删除列表中
        paragraphs_to_delete.append(paragraph)
        

# 删除原来的段落aphs_to_delete:
    paragraph._element.getparent().remove(paragraph._element)

doc.save(r'C:\Users\jg2yXRZ\OneDrive\桌面\测试word换行符\234.docx')



终端显示:

说明:读取表格里的手动换行符3个,段落标记包含了表格内的1个

运行后:

思考:

Python的替换与word直接批量查找替换不同,

1、word可以对全文中段落和表格中的手动换行符全部替换

2、以上Python代码(只涉及table)只能对word表格文字中的手动换行符进行删除和重新写入段落,从而获得段落标记回车符

其他测试

把手动换行符与段落标记的位置换一下,看看结果是否有误差。

测试1:

它分析了表格里的2个手动换行符号,和2个段落标记

测试2

测试3

测试4

  • 11
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

阿夏reasonsummer

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值