Datawhale学习
lishu921007
这个作者很懒,什么都没留下…
展开
-
Datawhale第17期组队学习(零基础入门金融风控)Task04:建模与调参
模型的选择多种多样,以下是贴了一些算法原理的网页,可以仔细学习。逻辑回归模型 https://blog.csdn.net/han_xiaoyang/article/details/49123419 决策树模型 https://blog.csdn.net/c406495762/article/details/76262487 GBDT模型 https://zhuanlan.zhihu.com/p/45145899 XGBoost模型 https://blog.csdn.net/wuzhongqian原创 2020-09-24 10:44:10 · 220 阅读 · 0 评论 -
Datawhale第17期组队学习(零基础入门金融风控)Task03:特征工程
在特征工程的工作中,以task02的EDA为基础,对数据特征的缺失值异常值要进行处理,然后再进一步的进行特征交互、特征编码、特征选择。特征工程的步骤主要分为部分:1.数据预处理:缺失值、异常值、错误值的处理2.特征提取:2.1类别特征2.1.1对于特征维度较低的类别特征可以采用变化、...原创 2020-09-24 10:25:31 · 132 阅读 · 1 评论 -
Datawhale第17期组队学习(零基础入门金融风控)Task02:数据分析(EDA)
进入了数据分析部分,我们首先就需要对数据进行一个全面的了解和熟悉,主要为了后面的特征工程分析打下基础。主要内容可以分为三个点:首先了解整个数据集的基本情况(包括缺失值,异常值等) 了解各个维度变量之间是否存在相关性(相关性分析等),变量与预测值之间存在的关系。 为特征工程打下基础,提前做好特征选择工作。首先需要做的工作是了解数据集大小,维度 熟悉数据类型 粗略查看数据集中各维度数据的基本统计量(通过describe函数) 查看缺失值情况 确认维度中存在唯一值的特征 分析数据类型...原创 2020-09-18 18:31:03 · 250 阅读 · 1 评论 -
Datawhale第17期组队学习(零基础入门金融风控)Task01:赛题理解
Tip:参加了Datawhale的第17期学习,内容是与天池联合发起的0基础入门系列赛事第四场 —— 零基础入门金融风控之贷款违约预测 挑战赛。课题是以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,这是一个典型的分类问题。通过这道赛题来引导大家了解金融风控中的一些业务背景,解决实际问题,帮助竞赛新人进行自我练习、自我提高。Task01的任务主要是以对赛题的理解和对赛题数据有一个大体的掌握了解,主要分为下面四个大类来进行。先通过p原创 2020-09-14 13:24:00 · 198 阅读 · 0 评论