归一化mysql函数_数据归一化转化

本文介绍了数据归一化在MySQL中的应用,包括特征二值化、四种特征归一化方法(总和标准化、标准差标准化、极大值标准化、极差标准化)以及连续特征变换和定性特征的One-hot编码。强调了不同归一化方法在树模型和参数模型中的适用性,以及如何使用Python实现这些方法。
摘要由CSDN通过智能技术生成

一、特征二值化

二、特征归一化

(一)、总和标准化

(二)、标准差标准化

(三)、极大值标准化

(四)、极差标准化(区间放缩法,0-1标准化)

三、连续特征变换

四、定性特征哑编码:One-hot编码

数据变换

数据变换即对数据进行规范化处理,以便于后续的信息挖掘。常见的数据变换包括:特征二值化、特征归一化、连续特征变化,定性特征哑编码等。

一、特征二值化

特征二值化的核心在于设定一个阈值,将特征与该阈值比较后,转话为0或1(只考虑某个特征出现与否,不考虑出现次数,程度),它的目的是将连续数值细粒度的度量转化为粗粒度的度量。

下面为Python实现特征二值化的方法:

7c7c65ca1bce67a8ab969b226b586ff4.png

结果如下:

4e82751b54f551cc3e52e79c0c1009a0.png

二、特征归一化

特征归一化也叫做数据无量纲化,主要包括:总和标准化、标准差标准化、极大值标准化、极差标准化。这里需要说明的是,基于树的方法是不需要进行特征归一化的,例如GBDT,bagging、boostin

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值