[python]记录一次对doc文件的处理过程

本文记录了一次使用Python处理doc文件的过程,包括将doc文件转换为docx格式,然后根据简历中的学校属性进行分类,并重命名为'姓名+学校+学校属性'的格式。在操作中,文件按学历高低进行排序,但未处理重名问题,这部分后续进行了手动操作。
摘要由CSDN通过智能技术生成

有小伙伴手里有很多简历,他想要根据简历的学校属性对简历进行分类,之后重命名为“姓名+学校+学校属性”的形式,并根据学历分别放入不同文件夹,但他只能提供doc格式的简历而python-docx包只能处理docx格式的文件。以下是处理过程:

第一步:批量把doc文件转换为docx格式

# coding:utf-8
from win32com import client as wc
import os

word = wc.Dispatch('Word.Application')

n = 0
for file_name in os.listdir("C:\\aaa\\resume"): ### 批量读入文件名称
	### 去除临时文件
	if "~$" in file_name:
		pass
	### 避免返回找不到文件的错误
	elif os.path.exists("C:\\aaa\\resume\\" + file_name) is False:
		pass
	else:
		doc = word.Documents.Open("C:\\aaa\\resume\\" + file_name) # 提取doc文件中的内容

		### 取简历主人姓名
		resume = file_name.split('_')
		resume_name_0 = resume[3]
		# print(resume_name_0)
		resume_name = resume_name_0[0:resume_name_0.index(".")]
		# print(resume_name)

		### 将文件以docx的格式保存
		resume_docx_name = resume_name + ".docx"
		doc.SaveAs("
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值