使用pandas做数据处理

这篇博客主要介绍了如何利用Pandas库进行数据处理,包括处理目的如计算行业占比、判断证券代码和审计机构特性,以及去除异常值。文中详细讲解了运用groupby、列表生成式、.loc、merge、concat、apply和lambda表达式等方法,并提到了在特定场景下如何使用Excel的逻辑判断功能。
摘要由CSDN通过智能技术生成

处理目的

  1. 对已有的指标进行简单的加减乘除处理
  2. 求单个企业营业收入的行业占比
  3. 根据证券代码判断是否是为ST
  4. 判断审计机构是否是四大
  5. 去除空值、去除资产负债率大于1的企业

使用函数、方法

  1. groupby
  2. 列表生成式
  3. .loc
  4. merge
  5. concat
  6. apply
  7. lambda表达式

具体操作

  1. 直接对对应索引 +、-、*、/
  2. 使用groupby,merge函数
df ['行业总值']= pd.merge(df,df.groupby("行业").sum
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值