python:读取excel文件并按行生成多个json文件

读写excel文件参考:https://www.jianshu.com/p/19219542bf23

excel文件:datarow.xls
该excel文件共有20400行,每400行为一个主题。
代码:将20400行按行分成51份,每400行存入一个json文件。

import xlrd
import json
import os
import jsonlines
# 按行读取excel文件,每400行生成一个json文件

#创建一个文件夹存放json文件
def createDirectoryStructure():
    directory = 'CMUDataRow'    
    if not os.path.exists(directory):       
    	os.makedirs(directory)
    
def processText(eachsubject,newfile):
    book = xlrd.open_workbook('datarow.xls') # 读取表格
    sheet1 = book.sheets()[0] # 读取sheet1
    
    # subject1读取1-400行生成json文件,subject2读取401-800行生成json文件,以此类推    
    for i in range(400*(eachsubject-1)+1,400*eachsubject+1):        
    	rowdata = sheet1.row_values(i) # 读取表中第i行
        with open(newfile, 'a') as f:            
        	json.dump(rowdata, f)            
        	f.write('\n')
        
def dataCleanup():    
	createDirectoryStructure()    
	# 生成51个json文件存入文件夹    
	for eachsubject in range(1,52):        
		newfile = ['CMUDataRow/subject{0}.json'.format(eachsubject)]        
		processText(eachsubject,newfile[0])        
		print()

if __name__ == '__main__':  
	dataCleanup()

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值