Python数据标准化

1.最小最大标准化

def MinMaxNorm(x):
    # 标准化
    min_val = np.nanmin(x, axis=0)
    max_val = np.nanmax(x, axis=0)
    for i in range(len(x)):
        x[i] = (x[i] - min_val) / (max_val - min_val)
    return x

2.Z-Score标准化

# 标准化
def robust_zscore(x: pd.Series, zscore=False):
    # https://en.wikipedia.org/wiki/Median_absolute_deviation
    # 删除以异常值
    x = x - x.median()
    mad = x.abs().median()
    x = np.clip(x / mad / 1.4826, -3, 3)
    
    # 标准化
    if zscore:
        x -= x.mean()
        x /= x.std()
    return x

3.Z-Score另一种表达方式

# Z值标准化
def standardize_z(dt):
    mean = dt.mean()     #  截面数据均值
    std = dt.std()       #  截面数据标准差
    return (dt - mean)/std

# norm_df = pd.DataFrame()
# norm_df["Date"] = process_data["Date"]
# norm_df["Code"] = process_data["Code"]

norm_df = pd.DataFrame()
for day in process_data.Date.unique():
    split_df = process_data[process_data["Date"]==day]
    split_df.iloc[:,2:] = (split_df.iloc[:,2:] - split_df.iloc[:,2:].mean())/split_df.iloc[:,2:].std()
    norm_df = norm_df.append(split_df)
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Python量化投资、代码解析与论文精读

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值