Python:pandas处理DataFrame

本文详细介绍了如何使用pandas库进行DataFrame数据处理,包括读取Excel文件、数据切片、列选择、索引重置、列名修改及基本计算。通过实例演示了iloc和loc方法的选择技巧,适合初学者理解Pandas数据操作流程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

DataFrame

1.读入数据
df = pd.read_excel('info.xlsx')
type(df)
# 输出
<class 'pandas.core.frame.DataFrame'>
2.获取前5行
df.head(5)
# 输出
	姓名	年龄	性别	籍贯
0	张三	31	男	上海
1	李四	24	男	北京
2	赵五	47	女	深圳
3	刘六	21	男	广州
4	谭七	19	女	香港
3.获取第3-4行
df[2:4]
# 输出
	姓名	年龄	性别	籍贯
2	赵五	47	女	深圳
3	刘六	21	男	广州
4.获取特定的列
df[['姓名', '籍贯']].head(2)
# 输出
	姓名	籍贯
0	张三	上海
1	李四	北京
5.使用整数下标选择行和列
df.iloc[0:3, 0:3]
# 输出
	姓名	年龄	性别
0	张三	311	李四	242	赵五	47

注:通过iloc属性实现

6.使用整数和标签的混合来选择行和列
df.loc[df.index[0:3], ['姓名', '性别']]
# 输出
	姓名	性别
0	张三	男
1	李四	男
2	赵五	女

注:通过loc属性实现

7.重置索引为姓名
df = df.set_index('姓名')
# 输出
	年龄	性别	籍贯
姓名			
张三	31	男	上海
李四	24	男	北京
赵五	47	女	深圳
刘六	21	男	广州
谭七	19	女	香港
8.更改列名
df.columns = 'a','b','c'
输出:
	a	b	c
姓名			
张三	31	男	上海
李四	24	男	北京
赵五	47	女	深圳
刘六	21	男	广州
谭七	19	女	香港
9.对数据进行计算
df['a'] = df['a']+2020
# 输出
	a	b	c
姓名			
张三	2052	男	上海
李四	2045	男	北京
赵五	2068	女	深圳
刘六	2042	男	广州
谭七	2040	女	香港

参考:https://mp.weixin.qq.com/s/b-rHS18WQoPJ78NbKaSaXQ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值