python批量分析表格_使用Python分析大量传感器数据

我是

Python的新手,我必须分析一个包含Excel格式的原始sensordata的大型数据集.

对于每个研究参与者,每个Excel数据文件大于100 MB. excelfile包含5张用于测量5种不同生理参数的薄片.每张纸包含超过100万行和两列(时间,生理参数).

在100万行sensordata之后,数据会自动在Excel文件的以下列(C和D)中继续.

每次我尝试在Python中加载数据文件时,都需要永远.我想知道几件事:

1)如何告诉Python从特定的Excel工作表中读取数据?这花了这么长时间是正常的吗?

这是我试过的:

df = pd.read_excel("filepath", sheet_name="Sheetname")

print (df.head (5))

2)使用Pandas在Python中为大型数据文件进行数据修改是否可行?我试过这个来加快这个过程:

import xlrd

work_book = xlrd.open_workbook('filepath', on_demand=True)

work_book.release_resources()

3)后来:我想比较不同研究参与者的生理参数.由于这是研究参与者之间的时间序列分析,我怎样才能在Python中开始这样做?

我在几天内学会了Python的基础知识,到目前为止我都很喜欢它.我意识到我还有很长的路要走.

更新:我想我刚刚完成了时间序列分析(实际上只是趋势分析,使用Dickey-Fuller测试和滚动均值可视化技术)! :D非常感谢你的帮助!大pandas中的“datetime”模块对我来说是最困难的,而我的日期时间列仍然被识别为“对象”.这是正常的吗?不应该是datetime64吗?

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值