实现pandas.DataFrame自由-精美的列加工篇

最新推荐文章于 2024-09-13 13:13:30 发布

托米老师代号9527

最新推荐文章于 2024-09-13 13:13:30 发布

阅读量207

点赞数 3

文章标签： pandas

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TommyDATA/article/details/142107907

版权

pandas.Series 的变换奥义：

1、在于 apply函数

def f(series的每一个元素):

return 你希望得到的最终元素

S = pd.Series([1,2,3])

S.apply(f)

妙用1：充当一个筛选条件（def的结果返回boolean）

def f(in_):

if 'csdn' in in_:

return True

filt = S.apply(f) # 形成了一列True or False ，长度等于 S.shape[0]

S_csdn_part = S[filt] # 解决series.str没有contains方法的烦恼

def f(in_):

return len(S[S==in_]) #def的结果类似于SQL的各种self-join

# 新手甚至会用很重value_counts后去merge(how = 'left') 这会复杂而易错

S_window_count = S.apply(f) # 解决了pandas并不友好支持SQL中window - function的痛苦

当然，这种一步骤的def，推荐可读性更高的lambda

S_window_count = S.apply(lambda x: len(S[S==x]) ) # 真正意义上的比SQL更简洁

托米老师代号9527

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

托米老师代号9527 卡布奇诺满上

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。