我想做什么?
pd.read_csv(... nrows=###)可以读取文件的前nrow。我希望在使用pd.read_hdf(...)时也这样做。在
有什么问题?
我被documentation搞糊涂了。start和{}看起来像我需要的,但是当我尝试它时,返回一个ValueError。我尝试的第二件事是使用nrows=10,认为它可能是允许的**kwargs。当我这样做时,不会抛出错误,但也会返回完整的数据集,而不是仅仅返回10行。在
问题:如何正确地从HDF文件中读取较小的行子集?(编辑:不必先把整件事读入内存!)在
以下是我的互动环节:>>> import pandas as pd
>>> df = pd.read_hdf('storage.h5')
Traceback (most recent call last):
File "", line 1, in
df = pd.read_hdf('storage.h5')
File "C:\Python35\lib\site-packages\pandas\io\pytables.py", line 367, in read_hdf
raise ValueError('key must be provided when HDF5 file '
ValueError: key must be provided when HDF5 file contains multiple datasets.
>>> import h5py
>>> f