用pandas读取Excel表,并生成dataframe格式进行进一步处理

这篇博客介绍了如何使用Python的pandas库读取Excel文件,将数据转换为dataframe格式,进行进一步处理,包括根据列间关系合成新变量、数据排序以及获取不重复值。还详细讲解了如何使用to_excel函数导出Excel文件,涵盖了参数设置和注意事项。
摘要由CSDN通过智能技术生成

利用pandas读取Excel表并处理成dataframe格式:

import pandas as pd

total_data = pd.read_excel('/Users/appler/Downloads/gzmxb.xls')
total_data = pd.DataFrame(total_data)
print(total_data)      #通常会通过print来检查一下是否顺利读取

进行数据的进一步处理,如:

(1)利用不同列之间的数量关系进行新变量的合成:

#通过运算形成新变量列
total_data["单位支付合计数"]=total_data["应付工资"]+total_data["单位缴纳社保"]+total_data["单位缴纳住房公积金"]
    
print(total_data)    #输出检查

pandas 获取DataFrame的规模(行数、列数)

df.info() 	    #显示行数、列数等
df.shape	    #获取行数和列数
len(df)	        #获取行数
len(df.columns)	#获取列数

(2)对不同列进行排序(多列条件排序)

df = pd.DataFrame({"A":[3,1,3,9,7],
                   "D":[666,1,888,5,3],
                   "C":[3,15,9,6,12],
                   "B":[2,4,6,10,8]},
   
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值