- 博客(15)
- 收藏
- 关注
原创 天池赛:世界杯数据可视化分析
2022世界杯在卡塔尔正如火如荼的进行,作为全球最受欢迎的体育运动,自然会吸引全世界无数球迷的目光,这也是历史上首次在冬季举办的世界杯。让我们一起来分析世界杯历史数据,看看能得出哪些有意思的结论吧。
2022-12-16 16:40:00
6887
6
原创 天池教学赛:银行客户认购产品预测
本次赛事由于样本不均衡的问题,简单训练可以到0.95左右,但要往上提分则需要不断的调参测试,让模型逼近数据的上限,最终通过多模型的中和,提高分数上限
2022-11-07 20:12:48
19438
65
原创 天池赛:宝可梦数据分析–龙系小精灵分享
本次比赛是一次不错的数据分析锻炼,即使你不了解宝可梦游戏,也可以通过数据得出客观的结论,并且这些结论都可以在百度得到验证,值得锻炼。
2022-09-12 22:43:21
3362
1
原创 天池长期赛:二手车价格预测(422方案分享)
本次比赛是一次很好的锻炼数据挖掘能力的入门赛,从EDA-数据清洗-特征工程-模型调参-模型融合,能够完整的学习到大数据的分析和挖掘,值得历练。
2022-09-01 06:00:00
12796
30
原创 天池数据分析达人赛3:汽车产品聚类(含代码)
汽车产品的聚类可以很好的通过参数将品牌进行区分,如果是以竞品为目的,需要从价格出发,选取相应特征进行聚类,在对类别下的竞品进行筛选,进行更加精准的汽车画像定位。
2022-08-01 19:24:47
4239
4
原创 天池学习赛:保险反欺诈预测(附代码)
保险欺诈的成本相对较低,所以很多人(外部人员和内部人员)铤而走险通过制造事故获利,反欺诈一直是保险公司及行业协会研究的课题,本次的学习赛在数据方面其实可以给保险公司一些启发,通过数据特征的构建及模型的学习,成为反欺诈场景应用中的新工具。...
2022-07-29 19:39:43
21864
72
原创 阿里云天池大数据长期赛:金融风控-贷款违约预测(含代码)
本次比赛让自己在大数据的处理流程上有了更明确的认知,从数据清洗、特征工程、数据建模,每一个过程都能学到很多经验和知识,值得去历练。
2022-07-19 19:57:46
11172
11
原创 基于RFM已赔案件客户细分
本案例目的不是筛选优质客户,而是筛选非优质客户,通过构建RFM指标,筛选金额较大、赔付周期较长、出险频率较高的客户,来为承保部门提供参考。
2022-07-02 20:32:20
489
原创 基于K-means车物未决案件聚类结果展示
K-means 是基于欧式距离的聚类算法,对凸簇数据比较有效,简洁和效率使得它成为所有聚类算法中最广泛使用的。
2022-07-01 18:40:45
459
原创 基于 Isolation Forest 未决案件异常检测结果展示
未决案件从某种程度上也可以算是无监督数据(因为没有历史标记),通过非监督式方法实现的异常检测可以缩小排查范围,提供更加精准和高效的执行目标。
2022-06-25 20:09:58
302
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人