pandas入门(2)——DataFrame数据结构
DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。DataFrame中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。
备注:虽然DataFrame是以二维结构保存数据的,但仍然可以轻松地将其表示为更高维度的数据(层次化索引的表格型结构。
创建1:直接传入一个由等长列表或NumPy数组组成的字典
data={'state':['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'],
'year':[2000, 2001, 2002, 2001, 2002, 2003],
'pop':[1.5, 1.7, 3.6, 2.4, 2.9, 3.2]}
frame=pd.DataFrame(data)
#只显示前5行
frame.head()
#指定序列顺序
pd.DataFrame(data,columns=['year','state','pop'])
在指定序列顺序时,如果传入的列在数据中找不到,就会在结果中产生缺失值,如
frame2 = pd.DataFrame(data, columns=['year', &