- 博客(3)
- 收藏
- 关注
原创 天池龙珠训练营Docker task3基础知识学习笔记
1、学习知识点概要:(1)学习特征预处理、缺失值、异常值处理、数据分桶等特征处理方法(2)学习特征交互、编码、选择的相应方法2、学习内容:(1)数据预处理(2)异常值处理(3)数据分箱(4)特征交互(5)特征编码(6)特征选择3、学习笔记:(1)数据预处理部分一般我们要处理一些EDA阶段分析出来的问题(象特征和数值特征尤为重要)(2)当你发现异常值后,一定要先分清是什么原因导致的异常值,然后再考虑如何处理(均分法,箱型法)(3)分箱的基本原则:(1)最小.
2021-04-28 22:30:23
75
原创 天池龙珠训练营Docker task2基础知识学习笔记
1、学习知识点概要:学习如何对数据集整体概况进行分析,包括数据集的基本情况2、学习内容:(1)了解数据集大小,原始特征维度;(2)查看数据缺失值情查看唯一值特征情况;(3)特征和特征之间关系,特征与目标变量之间关系3、学习笔记:代码示例步骤:(1)导入数据分析及可视化过程需要的库使用pip install已安装好的库,(2)读取文件(读取文件的拓展知识)了解TSV与CSV的区别:(3)查看数据集的样本个数和原始特征维度(4)查看数据集中特征缺失值,唯一值等..
2021-04-24 16:02:45
71
原创 天池龙珠训练营Docker基础知识学习笔记
1、学习知识点概要:了解赛题,实现最高收益的学习(1)赛题概要 (2)数据概况 (3)预测指标 (4)分析赛题2、学习内容:知道了这次比赛是以预测金融风险为任务,我们需要通过某些信贷平台的贷款记录推断出此人是否有违约的风险。我们可以从中了解金融风控中的一些业务背景,解决实际问题,帮助竞赛新人进行自我练习、自我提高。3、学习问题与方法:对于数据概况中的名词记忆不清,无法在第一时间考到英文想到对应的名词。对于预测指标中的概念公式不够理解,对相似的公式容易记忆混乱。虽然困难,...
2021-04-22 21:59:50
89
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人