入门学习
z_DECADE_zb
这个作者很懒,什么都没留下…
展开
-
3、Datawhale入门-特征工程
1 目的1.对数据的特征进一步分析,并进行处理2.数据特征分析的可视化2 特征处理2.1 异常处理通过箱线图(或 3-Sigma)分析删除异常值;BOX-COX 转换(处理有偏分布);长尾截断;2.2 特征归一化/标准化标准化(转换为标准正态分布);归一化(抓换到 [0,1] 区间);针对幂律分布,可以采用公式log((1+x)/(1+????????????????????????))2.3 数据分桶等频...原创 2020-03-28 21:25:27 · 185 阅读 · 0 评论 -
2、Datawhale入门-数据分析
0. EDA学习概念探索性数据分析(Exploratory Data Analysis,简称EDA)是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。分析变量1、频率和众数:针对于无序的分类的变量2、百分位数:针对于有序的或连续的变量3、位置度量:均值和中位数4、方差、标准...原创 2020-03-24 21:32:58 · 260 阅读 · 0 评论