- 博客(1)
- 收藏
- 关注
原创 2020招行Fintech数据竞赛总结
赛题背景 主办方提供了两个数据集(训练数据集和评分数据集),包含用户标签数据、过去60天的交易行为数据、过去30天的APP行为数据。希望参赛选手基于训练数据集,通过有效的特征提取,构建信用违约预测模型,并将模型应用在评分数据集上,输出评分数据集中每个用户的违约概率。 一、 数据预处理 (1)观察数据分布。这里要将tag表训练数据和测试数据连接方便做特征工程,其他表也做相似处理。 #加载tag表数据 train_tag = pd.read_csv('train_data/train_tag.csv'
2020-06-12 09:33:35 2633 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人