数据挖掘与机器学习：数据变换

Shining0596

已于 2022-11-08 20:39:46 修改

阅读量1k

点赞数

分类专栏：机器学习数据挖掘学习文章标签：数据挖掘学习其他

于 2022-11-08 20:39:08 首次发布

本文链接：https://blog.csdn.net/m0_58153897/article/details/127757935

版权

学习同时被 3 个专栏收录

94 篇文章 13 订阅

订阅专栏

机器学习

25 篇文章 11 订阅

订阅专栏

数据挖掘

21 篇文章 0 订阅

订阅专栏

第一关：极小极大归一化

任务描述：

第一关：极小极大归一化

任务描述：

本关任务：进行数据的极大极小归一化处理。

编程要求：

根据提示，在右侧编译器中的 begin-end 代码块内完成极小极大归一化函数代码。

测试说明：

平台会对你编写的代码进行测试：

预期输出：

value1 value2 value1_n value2_n
0 13.071792 20.708234 0.673810 0.155708
1 2.300139 74.246953 0.081684 0.761993
2 19.005657 39.215413 1.000000 0.365288
3 9.643828 18.225652 0.485372 0.127595
4 17.449491 74.353941 0.914456 0.763205

开始你的任务吧，祝你成功！

import numpy as np
import pandas as pd

np.random.seed(1000)
df = pd.DataFrame({"value1": np.random.rand(10) * 20,
                   'value2': np.random.rand(10) * 100})


# 创建函数，标准化数据
def data_norm(df, *cols):
    df_n = df.copy()
    ############## Begin ##############
    for col in cols:
        ma = df_n[col].max()
        mi = df_n[col].min()
        df_n[col + '_n'] = (df_n[col] - mi) / (ma - mi)
    ############## End ##############
    return df_n


df_n = data_norm(df, 'value1', 'value2')
print(df_n.head())

第二关：0均值标准化：

任务描述：

本关任务：进行数据的0均值标准化处理。

编程要求：

根据提示，在右侧编译器的 begin-end 代码块内完成 0 均值标准化函数代码。

测试说明：

平台会对你编写的代码进行测试：

预期输出：

value1 value2 value1_Zn value2_Zn
0 65.358959 20.708234 0.520694 -1.024567
1 11.500694 74.246953 -1.093571 0.565028
2 95.028286 39.215413 1.409956 -0.475078
3 48.219140 18.225652 0.006971 -1.098276
4 87.247454 74.353941 1.176746 0.568204
5 21.233268 6.958208 -0.801862 -1.432813
6 4.070962 88.533720 -1.316258 0.989210
7 39.719446 95.264440 -0.247785 1.189049
8 23.313220 93.114343 -0.739520 1.125211
9 84.174072 41.543095 1.084629 -0.405968
标准化后value1的均值为:-0.00, 标准差为：1.00

开始你的任务吧，祝你成功！

import numpy as np
import pandas as pd

np.random.seed(1000)
df = pd.DataFrame({"value1": np.random.rand(10) * 100,
                   'value2': np.random.rand(10) * 100})
# print(df.head())

# 创建函数，标准化数据

def data_Znorm(df, *cols):
    df_n = df.copy()
    ############## Begin ##############
    for col in cols:
        u = df_n[col].mean()
        std = df_n[col].std()
        df_n[col + '_Zn'] = (df_n[col] - u) / std
    ############## End ##############
    return (df_n)

Shining0596

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
数据挖掘与机器学习：数据变换

第一关本关任务：进行数据的极大极小归一化处理。根据提示，在右侧编译器中的 begin-end 代码块内完成极小极大归一化函数代码。第二关根据提示，在右侧编译器的 begin-end 代码块内完成 0 均值标准化函数代码。本关任务：进行数据的0均值标准化处理。
复制链接

扫一扫