具体想法
这段时间通过是使用Windows的番茄盒子,效果不错,但是发现其中有些反面还是有些不足。
数据展示阶段太丑,用的库不好
导出的数组为分为三个时间段,原本相连的内容就分开了,让人不舒服。
为了以后自己能够对这些记录的数据做更好的数据展示优化,我决定自己先对数据进行处理,然后导入数据库库。
遇到两个问题
xls文件无法直接通过open函数打开,需要使用xlwt库进行转换。学习成本有点高
具体思路如下
使用panda库直接将原xls文件0转化为csv文件1
对文件1的内容格式化输出到文件2
打开文件2合并之前由系统产生的散乱的记录,并输入到文件3
很浪费存储空间,也浪费时间,但是鉴于这是个人的一个数据量处理,这些内容,忽略不计。反正只是为了满足个人需要。
详细代码
# 目的为了xsl文档到csv文档的转换
import pandas as pd
import csv
def xlsx_to_csv_pd(sourceFile, targetFile):
"""对xls文档进行转化,并且结构进行优化
:param sourceFile: 原文件名
:param targetFile: 目的文件名
:return: 无
"""
# 初步格式化
data_xls = pd.read_excel(sourceFile, index_col=0)
tempFile = "tempFile.csv"</