比赛
文章平均质量分 61
莱维贝贝、
这个作者很懒,什么都没留下…
展开
-
数据分析与预处理常用的图和代码
(ps: 从图中可以发现,随着学历的提高,同学历情况下,选择分期付款占比越来越小)(ps:查看那些特征,在训练数据和测试数据上存在较大差异,如果存在,删去)(ps:查看那些特征,可以将不同类别的标签数据分开)利用递归的方法进行,特征筛选。原创 2023-05-22 15:55:01 · 866 阅读 · 0 评论 -
2023招商Fintech数据赛道rank33 赛后分享
2023招商Fintech数据赛道rank33 赛后分享原创 2023-05-06 23:45:12 · 2289 阅读 · 7 评论 -
算法模型的开发流程
项目的背景是什么?银行每年都要面对严重的客户流失问题,构建客户预警模型,输出客户流失概率,分析出一个客户是否可能是潜在的易流失客户对银行具有极大的价值。项目的目标是什么?根据用户基本信息与历史账单信息,构建有效的客户流失预警模型,并分析客户流失前的主要特征。项目的评估指标是什么?评估指标是AUC(这个指标需要甲方的需求而定)项目的数据与项目的目标是否存在关系?训练数据与目标存在关系(如果不存在关系,你模型再好,也没用)。评估指标和业务目标是否一致?原创 2023-02-22 16:13:44 · 1260 阅读 · 0 评论 -
机器学习之模型融合(Stacking、Blending。。。。)
简单快速:平均、投票全面精准:Stacking、Blending。原创 2023-01-04 17:29:14 · 1058 阅读 · 1 评论 -
2022 年首届钉钉杯大学生大数据挑战赛初赛的Baseline
在今天的数字世界,每天有数万亿的银行卡交易发生,检测欺诈行为的发生 是一个严峻挑战。原创 2022-08-01 20:41:15 · 1151 阅读 · 0 评论 -
2022招商FinTech比赛总结
此博文为了记录双非研究生在此次比赛中的感受,以及学习到的内容比赛介绍FineTech比赛时招商银行举办的比赛,总共有三个赛道研发、数据、产品,比赛奖励不仅有奖金,还有实习offer,每年举办时间都是一样的;我选择了熟悉又陌生的数据赛道比赛,熟悉是因为以前参加过结构性比赛,陌生是因为上次参加还是2021年的事情了,最主自己不是本科班的出生,本科时候是学爬电线杆的,现在搞的是通信;(当初参加这个比赛,是奔着实习和三日游去的,当得知,即使在200名之内,也会因背景原因而收不到面试,但是有奖金)比赛过程.原创 2022-06-24 15:58:28 · 1542 阅读 · 0 评论 -
CCF的基于UEBA的用户上网异常行为分析baseline(线上0.9263)
基于UEBA的用户上网异常行为分析比赛地址链接:https://www.datafountain.cn/competitions/520数据:代码:import pandas as pdimport numpy as npfrom sklearn.preprocessing import LabelEncoderimport lightgbm as lgbfrom sklearn.model_selection import KFoldfrom category_encoders imp原创 2021-09-24 17:42:24 · 1451 阅读 · 1 评论