首先,先说一个小知识:
在word文档中直接按回车叫硬回车表示分段;
shift 加 回车是软回车:表示换行
emnnn反正我只用过硬回车( ̄_, ̄ )
在使用文档时的区别就是你使用首行缩进,前者会缩进,后者不会
在程序里的区别就是
前者被认为是 '' ,空,(单引号里啥也没有)
后者被认为是 '\n',换行符,
说到这里进行过txt文本除去空行的小伙伴相信已经明白了还是for 加 if
代码如下:
测试1
#注释
测试2
#注释
测试3
测试4
测试5
# 以上是文档里的内容 '#注释'就是内容本身
import docx
file = docx.Document("C:/Users/Administrator/Desktop/3.docx") # 这种格式我也不知道通用不,用自己的叭
w = []
for i in file.paragraphs:
if '#' in i.text or i.text == '': # '#'是我的文档里有的 我只去除了硬回车
pass
else:
w.append(i.text) # 这是我用来测试看看空白行到底代表啥的
print(i.text)
print(w) # 这是我用来测试看看空白行到底代表啥的
# 以下是结果
测试1
测试2
测试3
测试4
测试5
['测试1', '测试2', '\n\n', '测试3', '测试4', '测试5']