数据分析与数据可视化代码块

  • 基于树的模型

基于树的模型能剥啄复杂的非线性关系并提供高精度和稳定性,有随机森林与梯度提升两类

  • 非树模型

太难了

numpy

特征归一化

min_max归一化

def rescale(feature):
    ans = feature.copy()
    for i in range(ans.shape[1]):
        ans[:, i] -= ans[:, i].min()
        q = ans[:, i].max()
        if q:
            ans[:, i] = ans[:, i] / q
    return ans

standardlization

def rescale(feature):
    ans = feature.copy()
    for i in range(ans.shape[1]):
        ans[:, i] -= ans[:, i].min()
        q = ans[:, i].max()
        if q:
            ans[:, i] = ans[:, i] / q
    return ans

pandas

列出DataFrame常用统计量

def common_statistic(df):
    columns=['mean','median','max','min','std','var']
    data=[]
    for c in df.columns:
        row=[
            df[c].mean(),
            df[c].median(),
            df[c].max(),
            df[c].min(),
            df[c].std(),
            df[c].var()
        ]
        data.append(row)
    statistic=pd.DataFrame(data=data,columns=columns,index=df.columns)
    return statistic

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值