一个DataFrame,它由3部分组成:
既有行索引(index),可以用来定位到具体的某一行。
也有列索引(columns),用来定位到具体的某一列。
通过index和columns,可以定位到一个值,能快速进行数据的筛选和定位。
在某种程度上,可以认为DataFrame是“具有相同index的Series的集合”。
第1行,导入pandas模块。
第3行,定义了一个字典。
第4行,定义了一个列表。
第6行,使用DataFrame构造函数创建了一个DataFrame,并赋值给了变量df。
第8行,将这个创建的DataFrame输出。
import pandas as pd
data= {'rank':[1, 2, 3, 4],'GDP':[80855, 77388, 68024, 47251]}
city= ['GD','JS','SD','ZJ']
df= pd.DataFrame(data, index=city)
print(df)
通过调用的pandas模块里的DataFrame()函数,可以构造一个DataFrame。
1. 传入字典(推荐)
我们来试一试,使用DataFrame构造函数,将定义的字典data和列表rank作为参数传入,生成一个DataFrame,并赋值给变量performance吧~
1
# 导入pandas模块,简称pd
2
import pandas as pd
3
4
# 定义一个字典data
5
data = {'name': ['May','Tony','Kevin'], 'score':[689,659,635]}
6
# 定义一个列表rank
7
rank = [1,2,3]
8
9
# 使用pd.DataFrame()函数,传入参数:字典data作为value和columns,列表rank作为index
10
# 构造出的DataFrame赋值给performance
11
performance = pd.DataFrame(data, index= rank)
12
13
# 输出performance这个DataFrame
14
print(performance)
output
name score 1 May 689 2 Tony 659 3 Kevin 635