适用于在线学习的动态特征缩放方法

最新推荐文章于 2024-07-10 14:32:33 发布

chencjiajy

最新推荐文章于 2024-07-10 14:32:33 发布

阅读量159

点赞数

分类专栏：机器学习文章标签：机器学习特征工程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/beingstrong/article/details/133975623

版权

机器学习专栏收录该内容

5 篇文章 1 订阅

订阅专栏

在机器学习任务中，不同的特征有不同的取值范围，因此特征缩放是必不可少的预处理过程步骤。

对于在线学习来说，不太可能仅根据已观察到的一些训练样本后就准确的确定特征的取值范围，此外，数据的分布也可能会随着时间的推移而改变。所以论文《Dynamic Feature Scaling for Online Learning of Binary Classifiers》针对在线学习应用场景提出了两种动态特征缩放方法。

1.无监督动态特征缩放

对于一个特征 $x_j$ ，如果特征的均值为 $\mu(x_j)$ ，标准差为 $\delta (x_j)$ ，进行特征标准化后有:
$x_j^{\prime} = \frac {x_j - \mu_j} {\delta_j}$
对于预处理步骤来说，我们可以根据训练集的所有样本来计算 $\mu$ 和 $\delta$ ，对于在线学习，可按照下式来进行更新它们的值:
$\begin{aligned} \mu_j^k &= m_j^k \\ \delta_j^k &= \sqrt{s^k_j / (k-1)} \\ m_j^k & =m_j^{k-1}+\frac{x_j^k-m_j^{k-1}}{k} \\ s^k & =s^{k-1}+\left(x_j^k-m_j^{k-1}\right)\left(x_j^k-m_j^k\right) \end{aligned}$

有监督动态特征缩放

相比于无监督动态特征缩放，会考虑样本的标签。

论文的实验结果表明无监督动态特征缩放方法相比于有监督特征缩放性能更好，暂时用不上，先偷个懒，后续补上这部分的笔记

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
适用于在线学习的动态特征缩放方法

适用于在线学习的动态特征缩放方法
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。