import xlrd
def read_excel():
# 打开文件,xxx/xxx/对应你的文件路径和名称
workbook = xlrd.open_workbook(r'xxx/xxx/xx.xls')
# sheet索引从0开始, 这里具体0/1/2这几个脚标可以再看一下是否有返回数据,或者返回数据是否能用,因为并不是很清楚sheet具体是如何使用的,可以查一下文档,或者看一下你们公司是否存在相关的打开和操作excel表的代码,个人理解是表名
sheet = workbook.sheet_by_index(0)
# 这里需要知道匹配的文档的目录是多少,自从查阅
fileDir = "xxx/xxx/xxx"
# 按照行去遍历,根据你的表格可以看出来是需要得到固定的5列和6列数据
for rown in range(sheet.nrows):
fileName = sheet.cell_value(rown, 4)
target_string = sheet.cell_value(rown, 5)
filePath = fileDir + fileName
# 读取文档 # target_string 位置
with open(filePath, 'r') as file:
content = file.read() # 获取文档中的所有内容
# 查找子字符串所在位置
start_index = content.find(target_string)
# 字符串的末尾位置
end_index = len(target_string)
# 做位置所谓哪部分判断 ,这里需要你确定一下,1/5的标准是否是按照end_index来计算的(个人理解是的,因为如果按照行数去计算可能在跨行问题,导致位置不准确的情况),那么我们按照是end_index的情况继续处理
# 利用end_index比全部内容长度就得出来具体是占用几分之几的结果了
result = end_index / len{content}
#最后一步就是 对excel文档的写入了,写到对应表格的某行某列中,这部分自己思考叭
if __name__ == '__main__':
read_excel();
注:参考文档
https://blog.51cto.com/u_16213360/7907576
https://blog.51cto.com/u_16213360/7680414
https://blog.csdn.net/u014597198/article/details/83104653