Python DataFrame结构及索引操作

最新推荐文章于 2025-03-20 09:07:44 发布

赵建澎

最新推荐文章于 2025-03-20 09:07:44 发布

阅读量5k

点赞数 2

本文链接：https://blog.csdn.net/zz5957/article/details/118549238

版权

本文详细介绍了Python中的DataFrame数据结构，包括Series的基础、DataFrame的创建与组成、索引操作、存储和读取（关联数据库）以及高级操作如替换、清洗和合并。DataFrame是二维表格数据，可进行高效运算，其内部由Series构成。文章还涵盖了如何利用iloc和loc进行索引取值，以及如何进行数据替换、清洗和合并等操作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

DataFrame的存储和读取操作（关联数据库）

DataFrame

一种二维表格的数据结构，可以用于存储数值型数据和文本数据，且可以对存储的数据进行高性能的运算和处理，且可以和数据库进行关联。

Series结构

是一种一维的存储数据的结构，单行或单列结构，是组成DataFrame的基本结构，二维的DataFrame中的单行和单列其实就是Series.

series组成（两部分）

values：一组数据，index：相关的数据索引标签

隐式索引:默认索引,数值型，显示索引:自定义,字符串

创建方式：

import numpy as np
import pandas as pd
#默认索引
s1 = pd.Series(data=[1,'two',3])
print(s1)

#显示索引
dic = {
    '英语':100,
    '数学':120,
    '理综':300
}
s2 = pd.Series(data=dic)

#自定义显示索引
s3 = pd.Series(data=[1,2,3],index=['a','b','c'])
print(s3)

Dataframe组成

创建方式：

添加表结构：多级列表方式写入

import numpy as np
import pandas as pd
from pandas import DataFrame,Series

#创建df:使用的默认的索引
df1 = DataFrame(data=[[1,2,3],[4,5,6]])
#通过numpy随机生成的数据填充df
df2 = DataFrame(data=np.random.randint(0,100,size=(5,6)))

#自定义索引
df3 = DataFrame(data=[[1,2,3],[4,5,6]],index=['a','b'],columns=['A','B','C'])
print(df3)

# #删除指定列

# df.drop(labels='Unnamed: 0',axis=1,inplace=True)

最低0.47元/天解锁文章