本质上,我需要做的是编写一个程序,接受许多.docx文件,并将它们放在一个文件中,以某种方式排序。我通过以下方式导入工作:import docx, os, glob
finaldocname = 'Midterm-All-Questions.docx'
finaldoc=docx.Document()
docstoworkon = glob.glob('*.docx')
if finaldocname in docstoworkon:
docstoworkon.remove(finaldocname) #dont process final doc if it exists
for f in docstoworkon:
doc=docx.Document(f)
fullText=[]
for para in doc.paragraphs:
fullText.append(para.text) #generates a long text list
# finaldoc.styles = doc.styles
for l in fullText:
# if l=='u\'\\n\'':
if '#' in l:
print('We got here!')
if '#1 ' not in l: #check last two characters to see if this is the first question
finaldoc.add_section() #only add a page break between questions
finaldoc.add_paragraph(l)
# finaldoc.add_page_break
# finaldoc.add_page_break
finaldoc.save(finaldocname)
但是我需要保留文本样式,比如字体颜色、大小、斜体等等,它们不在这个方法中,因为它只是获取原始文本并将其转储。我在pythondocx文档中找不到任何关于保留文本样式或导入非原始文本的内容。有人知道怎么做吗?在