背景
源数据是Excel给出的,按时间记录,而时间是常规格式,一串长长的数字。我想要把Excel导入python DataFrame, 以时间"hh-mm-ss"为Index。还涉及到把时间离散化。
遇到的问题
- 批量转换Excel中的‘时间’列数据格式
- 理论上时间是每20s记录一条数据的,但是在输出的时间可能有微小的偏差(如本应是00:00:00整,但实际记录下的时间是00:00:00.35),这就导致本来应该离散的取值范围变连续了。
我的解决办法
- 还不会弄,我手动调的,以后如果会了再来补上。
- 一个笨办法。通过手动把Excel调整为我想要的格式后,保存为.csv格式,然后再用以下代码读取数据。即通过另存为.csv来降低Excel数据的精度,这样子时间数据就转换为str格式。
readtable = pd.read_csv(str(sensor) + '-08-' + str("%02d" % i) + '.csv',
index_col = 0,
usecols = sensorNom[sensor].dropna())
2020.11.9更新
以上问题都可以通过pandas里面时间戳相关操作实现
- 读取数据后,将时间序列转换成datetime格式即可,还可以指定数据的输出形式,一下子两个问题都解决了
df['GlobalTime'] = pd.to_datetime(df['GlobalTime'])
df['GlobalTime'].strftime('%Y%m%d %H:%M:%S')
# 假如想要精确到小时,可以:
df['GlobalTime'].strftime('%Y%m%d %H')