python keyerror列名报错_python – Pandas在读取制表符分隔的数据时似乎忽略了第一个列名,给出了KeyError...

最新推荐文章于 2024-07-08 19:45:53 发布

weixin_39963534

最新推荐文章于 2024-07-08 19:45:53 发布

阅读量855

点赞数

文章标签： python keyerror列名报错

我在Ubuntu 13.10上的ipython3中使用pandas 0.12.0,以便在txt文件中拼写大的制表符分隔数据集.使用read_table从txt创建DataFrame似乎工作,第一行作为标题读取,但尝试使用其名称作为索引访问第一列会引发KeyError.我不明白为什么会发生这种情况,因为列名都显示已正确读取,并且每个其他列都可以这种方式编入索引.

数据如下所示：

RECORDING_SESSION_LABEL LEFT_GAZE_X LEFT_GAZE_Y RIGHT_GAZE_X RIGHT_GAZE_Y VIDEO_FRAME_INDEX VIDEO_NAME

73_1 . . 395.1 302 . .

73_1 . . 395 301.9 . .

73_1 . . 394.9 301.7 . .

73_1 . . 394.8 301.5 . .

73_1 . . 394.6 301.3 . .

73_1 . . 394.7 300.9 . .

73_1 . . 394.9 301.3 . .

73_1 . . 395.2 302 1 1_1_just_act.avi

73_1 . . 395.3 302.3 1 1_1_just_act.avi

73_1 . . 395.4 301.9 1 1_1_just_act.avi

73_1 . . 395.7 301.5 1 1_1_just_act.avi

73_1 . . 395.9 301.5 1 1_1_just_act.avi

73_1 . . 396 301.5 1 1_1_just_act.avi

73_1 . . 395.9 301.5 1 1_1_just_act.avi

15_1 395.4 301.7 . . . .

分隔符绝对是制表符,并且没有尾随或前导空格.

这个最小程序发生错误：

import pandas as pd

samples = pd.read_table('~/datafile.txt')

print(samples['RECORDING_SESSION_LABEL'])

这给出了错误：

---------------------------------------------------------------------------

KeyError Traceback (most recent call last)

in ()

----> 1 print(samples['RECORDING_SESSION_LABEL'])

/usr/lib/python3/dist-packages/pandas/core/frame.py in __getitem__(self, key)

2001 # get column

2002 if self.columns.is_unique:

-> 2003 return self._get_item_cache(key)

2004

2005 # duplicate columns

/usr/lib/python3/dist-packages/pandas/core/generic.py in _get_item_cache(self, item)

665 return cache[item]

666 except Exception:

--> 667 values = self._data.get(item)

668 res = self._box_item_values(item, values)

669 cache[item] = res

/usr/lib/python3/dist-packages/pandas/core/internals.py in get(self, item)

1654 def get(self, item):

1655 if self.items.is_unique:

-> 1656 _, block = self._find_block(item)

1657 return block.get(item)

1658 else:

/usr/lib/python3/dist-packages/pandas/core/internals.py in _find_block(self, item)

1934

1935 def _find_block(self, item):

-> 1936 self._check_have(item)

1937 for i, block in enumerate(self.blocks):

1938 if item in block:

/usr/lib/python3/dist-packages/pandas/core/internals.py in _check_have(self, item)

1941 def _check_have(self, item):

1942 if item not in self.items:

-> 1943 raise KeyError('no item named %s' % com.pprint_thing(item))

1944

1945 def reindex_axis(self, new_axis, method=None, axis=0, copy=True):

KeyError: 'no item named RECORDING_SESSION_LABEL'

简单地进行打印(样本)可以得到打印整个表的预期输出,包括第一列及其标题.尝试打印任何其他列(即;完全相同的代码,但’RECORDING_SESSION_LABEL’替换为’LEFT_GAZE_X’)可以正常工作.此外,标题似乎已正确读取,并且pandas将’RECORDING_SESSION_LABEL’识别为列名.这可以通过使用.info()方法并查看样本的.columns属性来证明：

>samples.info()

Int64Index: 28 entries, 0 to 27

Data columns (total 7 columns):

RECORDING_SESSION_LABEL 28 non-null values

LEFT_GAZE_X 28 non-null values

LEFT_GAZE_Y 28 non-null values

RIGHT_GAZE_X 28 non-null values

RIGHT_GAZE_Y 28 non-null values

VIDEO_FRAME_INDEX 28 non-null values

VIDEO_NAME 28 non-null values

dtypes: object(7)

>print(samples.columns)