自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 广工大数协 阿里云天池 金融风控训练营·Task 03特征工程打卡笔记

一、学习知识点概要本节主要学习一些特征处理、特征交互、编码、选择的方法,以及如何处理缺失值和异常值二、学习内容数据预处理 前面在数据探索性分析的过程中,我们已经得到数据的一些基本统计量的数值,同时也发现了问题,比如缺失值、异常值等,那么我们就要对这些异常的数据进行处理 缺失值填充 将所有缺失值指定为0,并用特定值填充缺失值 时间格式处理 要将issueDate的数据转化为指定的时间格式,并对earliesCreditLine进行预处理 类别特征处理 要将数据

2021-04-28 22:09:48 106

原创 广工大数协 阿里云天池 金融风控训练营·Task 02EDA探索性数据分析打卡笔记

一、学习知识点概要task2 主要是让我们了解数据总体,学会如何挖掘数据内部信息,掌握读取数据集的技巧与数据特征,学会查看数据类型并生成数据报告。二、学习内容读取文件→掌握数据基本特征及基本统计量→查看缺失值和唯一值→查看特征的类型读取文件在上个任务中已进行详细学习,这里不再赘述 掌握数据基本特征及基本统计两量 我们要挖掘数据,就要掌握其基本信息。通过代码,查看数据的样本个数、数据类型、基本统计量(如平均值、方差、最大值、最小值等) 查看缺失值和唯一值 缺失值是什么 缺失值是

2021-04-25 23:50:01 102

原创 广工大数协 阿里云天池 金融风控训练营·Task 01赛题理解打卡笔记

一、学习知识点概要task 1部分对本次比赛进行了大致介绍,重点解释了数据的含义及数据指标,为之后的比赛打好基础。二、学习内容本次比赛采用分类算法,其主要评估指标为混淆矩阵、精确率、准确率、召回率、F1 score、P-R曲线、ROC、AUC等1、混淆矩阵2、精确率指预测为正的样本中正确预测的样本所占比例3、准确率指所有样本中正确预测的样本所占比例4、召回率指正样本中正确预测的样本比例5、F1 scoreF1 score/2 = 1/精确率 + 1/召回率

2021-04-22 23:02:17 134

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除