pandas 笔记003
三、DataFrame索引的创建和基本用法
DataFrame
是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的数据类型。
DataFrame
既有行索引,也有列索引,可以看作有Series索引组成的字典(共用一个索引),数据是以二维结构存放的。
1.DataFrame索引的创建
字典类:
-
数组、列表或元组构成的字典构造dataframe
-
Series构成的字典构造dataframe
-
字典构成的字典构造dataframe
列表类:
-
2D ndarray 构造dataframe
-
字典构成的列表构造dataframe
-
Series构成的列表构造dataframe
import numpy as np
import pandas as pd
1.1 字典类构造dataframe
1.1.1 数组、列表或元组构成的字典构造dataframe
注意:数组、列表或元组的元素个数要相同,否则报错
#构造一个字典
dict = {
'a':[1,2,3,4],
'b':(5,6,7,8),
'c':np.arange(1,5)} #数组、列表或元组的元素个数要相同,否则报错
#构造dataframe
frame = pd.DataFrame(dict)
frame
a b c
0 1 5 1
1 2 6 2
2 3 7 3
3 4 8 4
指定索引行和列
注意:指定的列索引数量可以大于原来的,如果值不是原来的会返回NAN。指定的行索引可随意变化。
#指定行索引,指定的列索引数量可以大于原来的,如果值不是原来的会返回NAN
frame = pd.DataFrame(dict,index=['A','B','C','D'],columns=['a','b','c',