我正在通过“
Python数据分析”书,并在“示例:2012联邦选举委员会数据库”部分中将数据读入DataFrame中.麻烦的是,即使将index_col参数设置为None,数据列之一始终被设置为索引列.
这是加载代码(为了节省检查时间,我设置nrows = 10):
import pandas as pd
fec = pd.read_csv('P00000001-ALL.csv',nrows=10,index_col=None)
为了保持短路,我排除了数据列输出,但这是我的输出(请不要索引值):
In [20]: fec
Out[20]:
Index: 10 entries, C00410118 to C00410118
Data columns:
...
dtypes: float64(4), int64(3), object(11)
这里是书的输出(再次列出数据列):
In [13]: fec = read_csv('P00000001-ALL.csv')
In [14]: fec
Out[14]:
Int64Index: 1001731 entries, 0 to 1001730
...
dtypes: float64(1), int64(1), object(14)
我的输出中的索引值实际上是文件中的第一列数据,然后将所有剩余的数据向左移动1.有谁知道如何防止这列数据列为索引?我想让索引只有1个增加整数.
我对蟒蛇和大pandas来说是相当新鲜的,所以对于造成不便,我深表歉意.谢谢.