Python——DataFrame中文叫数据框。是pandas模块最常用的数据类型，是一个二维的矩阵数据表。

最新推荐文章于 2024-05-14 08:16:58 发布

请叫我格姐

最新推荐文章于 2024-05-14 08:16:58 发布

阅读量5.8k

点赞数 6

文章标签： python

原文链接：https://np.baicizhan.com/data_analysis/lesson/4/page/45

版权

一个DataFrame，它由3部分组成：

既有行索引（index），可以用来定位到具体的某一行。

也有列索引（columns），用来定位到具体的某一列。

通过index和columns，可以定位到一个值，能快速进行数据的筛选和定位。

在某种程度上，可以认为DataFrame是“具有相同index的Series的集合”。

第1行，导入pandas模块。
第3行，定义了一个字典。
第4行，定义了一个列表。
第6行，使用DataFrame构造函数创建了一个DataFrame，并赋值给了变量df。
第8行，将这个创建的DataFrame输出。

import pandas as pd

data= {'rank':[1, 2, 3, 4],'GDP':[80855, 77388, 68024, 47251]}
city= ['GD','JS','SD','ZJ']

df= pd.DataFrame(data, index=city)

print(df)

通过调用的pandas模块里的DataFrame()函数，可以构造一个DataFrame。

1. 传入字典（推荐）

我们来试一试，使用DataFrame构造函数，将定义的字典data和列表rank作为参数传入，生成一个DataFrame，并赋值给变量performance吧～

# 导入pandas模块，简称pd

import pandas as pd

# 定义一个字典data

data = {'name': ['May','Tony','Kevin'], 'score':[689,659,635]}

# 定义一个列表rank

rank = [1,2,3]

# 使用pd.DataFrame()函数，传入参数：字典data作为value和columns，列表rank作为index

# 构造出的DataFrame赋值给performance

performance = pd.DataFrame(data, index= rank)

# 输出performance这个DataFrame

print(performance)

output

    name  score
1    May    689
2   Tony    659
3  Kevin    635

关注