word文档的读入（4）

fmc121104

于 2024-09-11 13:30:09 发布

阅读量568

点赞数 8

文章标签：前端 java python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fmc121104/article/details/142137449

版权

刚刚我们获取到的是段落和样式块对象，要想读取到真正的文本内容，需要通过.text属性来访问。
不同的需求对应不同的操作。比如：
如果想读取某一段落中的所有文本，就使用.paragraphs[{段落索引}]获取到段落对象后，再访问它的.text属性；如果想读取某一个样式块中的文本内容，则是在使用doc.paragraphs[{段落索引}].runs[{样式块索引}]读取到具体的样式块对象后，访问.text属性。

逐步完善代码（根据注释，填写代码。）

本例中，展示了读取学号的具体代码，也就是读取第四段的第二个样式块的文本内容。
我们将读取出来的结果存储到了studentData字典里的id键中。
在代码最后，使用print输出了存储所有学生信息的列表allStudentsData。

# 使用import导入os模块

import os

# 使用import导入docx

import docx

# 将乔老师的答题卡文件夹路径 /Users/qiao/answerKey 赋值给变量allKeyPath

allKeyPath = "/Users/qiao/answerKey"

# 使用os.listdir()函数获取该路径下所有的文件，并赋值给变量allItems

allItems = os.listdir(allKeyPath)

# 定义一个空列表allStudentsData存储所有学生数据

allStudentsData = []

# 使用for循环逐个遍历所有学生答题卡

for item in allItems:

# 定义一个空字典studentData存储单个学生数据

studentData = {}

# 使用os.path.splitext()函数获取文件名的前半段，并赋值给变量fileName

fileName = os.path.splitext(item)[0]

# 使用split()函数以"-"分隔文件名，将第1部分班级信息赋值到学生数据字典的classInfo键里

studentData["classInfo"] = fileName.split("-")[0]

# 使用split()函数以"-"分隔文件名，将第2部分姓名信息赋值到学生数据字典的name键里

studentData["name"] = fileName.split("-")[1]

# 使用os.path.join()函数拼接出答题卡路径，并赋值给变量keyPath

keyPath = os.path.join(allKeyPath, item)

# 读取答题卡并赋值给变量doc

doc = docx.Document(keyPath)

# 读取第四段学号段，并赋值给变量idPara

idPara = doc.paragraphs[3]

# 读取学号段中第二个样式块，并赋值给变量idRun

idRun = idPara.runs[1]

# 读取学号，并赋值到学生数据字典的id键里

studentData["id"] = idRun.text

# 使用append()函数将studentData添加到总学生数据allStudentsData中

allStudentsData.append(studentData)

# 使用print输出变量allStudentsData

print(allStudentsData)

总结：

现在，乔老师已经能很轻松地将学生的学号提取出来了。
明天的课程里，我们将用类似的方法逐行读取填空题答案，并通过判断学生答案与标准答案是否一致来计算分数。
选择题的答案读取因为涉及到表格的读取，将在第四天的课程中学习。

关注

8
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
word文档的读入（4）

使用split()函数以"-"分隔文件名，将第1部分班级信息赋值到学生数据字典的classInfo键里。使用os.path.splitext()函数获取文件名的前半段，并赋值给变量fileName。使用split()函数以"-"分隔文件名，将第2部分姓名信息赋值到学生数据字典的name键里。本例中，展示了读取学号的具体代码，也就是读取第四段的第二个样式块的文本内容。刚刚我们获取到的是段落和样式块对象，要想读取到真正的文本内容，需要通过。选择题的答案读取因为涉及到表格的读取，将在第四天的课程中学习。
复制链接

扫一扫

fmc121104 CSDN认证博客专家 CSDN认证企业博客

码龄1年

47: 原创

3万+: 周排名

2万+: 总排名

4万+: 访问

: 等级

1562: 积分

785: 粉丝

1085: 获赞

14: 评论

608: 收藏

私信

关注

热门文章

最新评论

【class11】人工智能初步（人脸识别（1））
CSDN-Ada助手: 恭喜您发布第20篇博客！看到您探讨人工智能初步中的人脸识别话题，深感您的学习热情和勤奋。希望您能继续坚持创作，不断分享您的学习心得和见解。或许在下一篇博客中，可以深入探讨人脸识别技术的发展历程或者与其他领域的结合应用，这样不仅能够加深自己的理解，也能够为读者提供更加丰富的内容。期待您的下一篇精彩博客！祝您学习进步，创作愉快！
【class2】人工智能初步（自然语言处理）
fmc121104: 谢谢你的喜欢，大家一起进步
【class2】人工智能初步（自然语言处理）
普通网友: 好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
【class3】人工智能初步（词频统计）
CSDN-Ada助手: 恭喜您撰写了第12篇博客！看到您关于人工智能初步的词频统计文章，对于深入了解人工智能这一领域有很大帮助。建议您在接下来的创作中，可以尝试结合实际案例或者应用场景，更加生动地呈现人工智能的应用与发展，让读者更容易理解并产生共鸣。期待您更多优质内容的分享！
【class4】建立人工智能系统（1）
CSDN-Ada助手: 恭喜您发布了第13篇博客“【class4】建立人工智能系统（1）”！您的持续创作精神令人钦佩。在下一步的创作中，或许可以深入探讨人工智能系统的具体应用场景，或者分享一些实际操作经验，让读者更加深入了解这一领域。希望您能继续保持创作热情，期待您更多精彩的分享！祝您一切顺利！

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。