![](https://img-blog.csdnimg.cn/2019092715111047.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
【数据科学】竞赛
文章平均质量分 62
该专栏用于记录数据科学竞赛,包括赛题理解、baseline、提分策略、赛后复盘等。其中baseline包含数据预处理、特征工程、建立模型等。
越吃越胖
学
展开
-
数据分析_泰坦尼克
泰坦尼克号生存预测作为最经典的启蒙数据分析项目,对于初学者来说是应该是最合适的了,后面将分享更多进阶的数据分析项目。如果已经有基础了,推荐: 全文如下: 本文结合泰坦尼克号生存预测,从1.数据探索(数据可视化),2.数据预处理,3.模型训练,4.模型调参这四个步骤进行了完整的梳理: 1. 数据概述与可视化 1.1 数据概述 首先我们导入我们的训练数据和测试数据: 数据集包含train.csv和test.csv两个文件,可以直接在kaggle官网上下载。 train_data = pd.read_csv("i原创 2020-09-07 14:34:18 · 551 阅读 · 0 评论 -
天池新人赛_信贷逾期预测_1赛题理解
本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第四场 —— 零基础入门金融风控之贷款违约预测挑战赛。 赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,这是一个典型的分类问题。通过这道赛题来引导大家了解金融风控中的一些业务背景,解决实际问题,帮助竞赛新人进行自我练习、自我提高。 项目地址:https://github.com/datawhalechina/team-learning-data-mining/tree/mast原创 2021-01-05 10:51:11 · 455 阅读 · 0 评论