过滤
筛选1961,2000,2015年的数据
dataset.filter(items=['1961', '2000', '2015'])
筛选出2000年,大于500的数值
dataset[(dataset['2000'] > 500)][['2000']]
检索始于2的全部列
dataset.filter(regex='^2',axis=1).head()
检索始于A的所有行
dataset.filter(regex='^A',axis=0).head()
检索包含land的所有国家
dataset.filter(like='land', axis=0).head()
排序
根据1961年中的数值进行排序
dataset.sort_values(by=['1961'])[['1961']].head()
2015列年的数据,降序排序
dataset.sort_values(by=['2015'],ascending=False)[['2015']].head()
重构
dataset_2015 = dataset[["Country Code",'2015']]
dataset_2015['temp'] = '2015'
dataset_2015.pivot(index=['temp'], columns='Country Code',values='2015')
pivo函数的参数
index:指定一列做为生成DataFrame对象的索引,如果为空则默认为原来的索引。
columns:指定一列的值作为列名,必须传值。
values:指定一列作为生成DataFrame对象的值。可以为空。