自从学了Python后就逼迫自己不用Excel,所有操作用Python实现。直接进入正题。
数据是网上找到的销售数据,长这样:
一、关联公式:Vlookup
vlookup是excel几乎最常用的公式,一般用于两个表的关联查询等。所以我先把这张表分为两个表。
df1=sale[["订单明细号","单据日期","地区名称", "业务员名称","客户分类", "存货编码", "客户名称", "业务员编码", "存货名称", "订单号", "客户编码", "部门名称", "部门编码"]]df2=sale[["订单明细号","存货分类", "税费", "不含税金额", "订单金额", "利润", "单价","数量"]]
需求:想知道df1的每一个订单对应的利润是多少。
利润一列存在于df2的表格中,所以想知道df1的每一个订单对应的利润是多少。用excel的话首先确认订单明细号是唯一值,然后在df1新增一列写:=vlookup(a2,df2!a:h,6,0) ,然后往下拉就ok了。(剩下13个我就不写excel啦)
那用python是如何实现的呢?
#查看订单明细号是否重复,结果是没。df1["订单明细号"].duplicated().value_counts()df2["订单明细号"].duplicated().value_counts()df_c=pd.merge(df1,df2,on="订单明细号",how="left"

本文介绍了使用Python处理Excel数据的十个常用操作,包括VLOOKUP的替代方法、数据透视表、两列差异比较、去重、缺失值处理、多条件筛选、模糊匹配、分类汇总、条件计算以及删除空格。通过实例展示了Python在数据分析中的高效能。
最低0.47元/天 解锁文章
&spm=1001.2101.3001.5002&articleId=110060955&d=1&t=3&u=16a80d318a174f80b8bb974027d51a94)

被折叠的 条评论
为什么被折叠?



