数据归一化

最新推荐文章于 2021-12-02 22:52:44 发布

李白_pro

最新推荐文章于 2021-12-02 22:52:44 发布

阅读量809

点赞数 1

分类专栏：归一化文章标签：数据归一化

本文链接：https://blog.csdn.net/weixin_42911609/article/details/86689865

版权

归一化专栏收录该内容

1 篇文章 0 订阅

订阅专栏

version：python 3.6
环境：anaconda/JupyterLab 0.27.0
操作系统：Windows 10

数据处理时经常用到数据归一化和标准化，但是一个数据集，不同字段之间的量纲和数据大小分布不一致。所以需要按列归一化，而不是直接对所有数据归一化。
下面是我写的函数，可以直接调用：

def minmax_scale(data):
    for col in feature_list:
        MAX = data[col].max()
        MIN = data[col].min()
        MEAN = data[col].mean()
        if MAX > MIN:
            data[col] = data[col].apply(lambda x: (float(x) - float(MIN)) / (float(MAX) - float(MIN))).fillna(MEAN)
        else:
            data[col] = (data[col] / float(MAX)).fillna(MEAN)
    return data

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

李白_pro

关注关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
数据归一化

version：python 3.6环境：anaconda/JupyterLab 0.27.0操作系统：Windows 10数据处理时经常用到数据归一化和标准化，但是一个数据集，不同字段之间的量纲和数据大小分布不一致。所以需要按列归一化，而不是直接对所有数据归一化。下面是我写的函数，可以直接调用：def minmax_scale(data): for col in feature...
复制链接

扫一扫