时序预测归一化

最新推荐文章于 2024-07-02 20:19:43 发布

撑死的猫

最新推荐文章于 2024-07-02 20:19:43 发布

阅读量3.3k

点赞数 4

分类专栏：机器学习文章标签：时序预测归一化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yinmengtingjoy/article/details/85781896

版权

机器学习专栏收录该内容

2 篇文章 1 订阅

订阅专栏

在做预测问题时，当数据的量纲存在较大差异时，归一化非常重要。以下问题是我遇到的：

1.多个维度的数据，是对每一个样本进行归一化？还是对每一个维度（属性）归一化

2.训练集和测试集放在一起归一化？还是分开归一化？

问题1：

对每一个属性进行归一化，从sklearn的文档中提到：MinMaxScaler，This estimator scales and translates each feature individually such that it is in the given range on the training set.

在上一篇博客中也使用了空气污染预测做了实验。

问题2：在搜集到的资料中，大部分都是将训练集和测试集放在一起归一化，可是这样测试集就对模型有了影响，只要换了测试集训练出来的模型就不一样。当使用训练好的模型去预测其他的数据集时，不知道是否合适。而且如果这样的话，每次一更换测试集就需要将其余训练集放在一起重新归一化，再去训练新的模型。目前为了更好的结果，我采用的是这种方法。

也有人提到用归一化训练集的最大最小值来归一化预测值，这样的话预测值就会被限定在一个范围，这样做的原因是：训练集和测试集应该是独立同分布的，有理由认为最大值和最小值就出现在训练集中。但在用python实现时，发现这样操作并不是很方便。

关注

4
点赞
踩
14

收藏

觉得还不错? 一键收藏
2
评论
时序预测归一化

在做预测问题时，当数据的量纲存在较大差异时，归一化非常重要。以下问题是我遇到的：1.多个维度的数据，是对每一个样本进行归一化？还是对每一个维度（属性）归一化2.训练集和测试集放在一起归一化？还是分开归一化？问题1：对每一个属性进行归一化，从sklearn的文档中提到：MinMaxScaler，This estimator scales and translates each fea...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。