各类特征的创建-业务统计特征创建

最新推荐文章于 2024-07-04 16:04:39 发布

weixin_45271076

最新推荐文章于 2024-07-04 16:04:39 发布

阅读量160

点赞数 3

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45271076/article/details/139495548

版权

在这里插入图片描述

# 创建空字典
aggs = {}

# 连续/离散字段统计量提取范围
for col in numeric_cols:
    aggs[col] = ['nunique', 'mean', 'min', 'max','var','skew', 'sum']
for col in categorical_cols:
    aggs[col] = ['nunique']    
aggs['card_id'] = ['size', 'count']
cols = ['card_id']

# 借助groupby实现统计量计算
for key in aggs.keys():
    cols.extend([key+'_'+stat for stat in aggs[key]])

df = transaction[transaction['month_lag']<0].groupby('card_id').agg(aggs).reset_index()
df.columns = cols[:1] + [co+'_hist' for co in cols[1:]]

df2 = transaction[transaction['month_lag']>=0].groupby('card_id').agg(aggs).reset_index()
df2.columns = cols[:1] + [co+'_new' for co in cols[1:]]
df = pd.merge(df, df2, how='left',on='card_id')

df2 = transaction.groupby('card_id').agg(aggs).reset_index()
df2.columns = cols
df = pd.merge(df, df2, how='left',on='card_id')
del transaction
gc.collect()

# 生成训练集与测试集
train = pd.merge(train, df, how='left', on='card_id')
test =  pd.merge(test, df, how='left', on='card_id')
del df
train.to_csv("preprocess/train_groupby.csv", index=False)
test.to_csv("preprocess/test_groupby.csv", index=False)

gc.collect()

在这里插入图片描述

weixin_45271076

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
各类特征的创建-业务统计特征创建

【代码】各类特征的创建-业务统计特征创建。
复制链接

扫一扫

weixin_45271076 CSDN认证博客专家 CSDN认证企业博客

码龄5年

147: 原创

10万+: 周排名

1万+: 总排名

17万+: 访问

: 等级

2186: 积分

76: 粉丝

138: 获赞

25: 评论

522: 收藏

私信

关注

热门文章

分类专栏

sas 3篇
自编码 2篇

最新评论

集成学习-Bagging与随机森林回归
程序小勇: 博主优质好文，技术分享到位，由浅入深，循序渐进，有深度，也不失广度.愿我们IT技术蓬勃发展，再创辉煌佳绩，相信有一天我们的技术也可以走向世界，改变世界。哈哈哈，已经三连，望互关互粉，谢谢！向大哥学习，请多多指教！
贝叶斯分类器做文本分类-单词计数向量和TF-IDF
歪打不正着的数据人: 为什么没有‘a’这个单词特征啊
用逻辑回归制作评分卡以及过采样和如何分箱及roc
m0_46518691: 有源码吗？可以分享一下吗
xgboost2 以及使用XGB.CV来进行调参
肖永威: 感谢分享，学习收藏了！👍
Feature Selection 特征选择（一） SelectFromModel
momo儿: 少年,我看你骨骼精奇,不如来我博客看看可好

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。