Python DataFrame结构及索引操作

本文详细介绍了Python中的DataFrame数据结构,包括Series的基础、DataFrame的创建与组成、索引操作、存储和读取(关联数据库)以及高级操作如替换、清洗和合并。DataFrame是二维表格数据,可进行高效运算,其内部由Series构成。文章还涵盖了如何利用iloc和loc进行索引取值,以及如何进行数据替换、清洗和合并等操作。
摘要由CSDN通过智能技术生成

目录

DataFrame

Series结构

Dataframe组成

Dataframe索引操作

DataFrame的存储和读取操作(关联数据库)

DataFrame高级操作

替换操作

 清洗操作

合并操作


DataFrame

一种二维表格的数据结构,可以用于存储数值型数据和文本数据,且可以对存储的数据进行高性能的运算和处理,且可以和数据库进行关联。

Series结构

是一种一维的存储数据的结构,单行或单列结构,是组成DataFrame的基本结构,二维的DataFrame中的单行和单列其实就是Series.

series组成(两部分)

        values:一组数据,index:相关的数据索引标签

隐式索引:默认索引,数值型,显示索引:自定义,字符串

创建方式:

import numpy as np
import pandas as pd
#默认索引
s1 = pd.Series(data=[1,'two',3])
print(s1)

#显示索引
dic = {
    '英语':100,
    '数学':120,
    '理综':300
}
s2 = pd.Series(data=dic)

#自定义显示索引
s3 = pd.Series(data=[1,2,3],index=['a','b','c'])
print(s3)

Dataframe组成

创建方式:

添加表结构:多级列表方式写入

import numpy as np
import pandas as pd
from pandas import DataFrame,Series

#创建df:使用的默认的索引
df1 = DataFrame(data=[[1,2,3],[4,5,6]])
#通过numpy随机生成的数据填充df
df2 = DataFrame(data=np.random.randint(0,100,size=(5,6)))

#自定义索引
df3 = DataFrame(data=[[1,2,3],[4,5,6]],index=['a','b'],columns=['A','B','C'])
print(df3)

# #删除指定列

# df.drop(labels='Unnamed: 0',axis=1,inplace=True)

  • 2
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值