python笔记19:数据处理之数据标准化

# -*- coding: utf-8 -*-
#概念:数据标准化,是指将数据按比例缩放,使之落入到特定区间
#0-1标准化计算公式: x* = (x-min) / (max - min)

#在多指标评价体系中,由于各评价指标的性质不同,通常具有不同的量纲和数量级。当各指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用。因此,为了保证结果的可靠性,需要对原始指标数据进行标准化处理。

import pandas

data = pandas.read_csv("D:/python/workspace/pythonStudy/19.csv")

data['scale'] = round(
(data.score-data.score.min()) / (data.score.max()-data.score.min()),
2
)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据标准化是一种常用的数据预处理方法,用于将不同尺度和范围的数据转化为统一的标准尺度。在Python,可以使用多种方法进行数据标准化处理,以下是两种常用的方法: 1. 最小-最大标准化(Min-Max标准化): 最小-最大标准化是将数据线性地映射到指定的最小值和最大值之间的过程。公式如下: ``` X_scaled = (X - X_min) / (X_max - X_min) ``` 其,X_scaled是标准化后的数据,X是原始数据,X_min是原始数据的最小值,X_max是原始数据的最大值。 以下是一个使用最小-最大标准化处理数据的示例代码: ```python from sklearn.preprocessing import MinMaxScaler data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]] scaler = MinMaxScaler() scaled_data = scaler.fit_transform(data) print(scaled_data) ``` 输出结果为: ``` [[0. 0. 0. ] [0.5 0.5 0.5 ] [1. 1. 1. ]] ``` 2. 标准差标准化(Z-score标准化): 标准差标准化是将数据转化为均值为0,标准差为1的分布。公式如下: ``` X_scaled = (X - X_mean) / X_std ``` 其,X_scaled是标准化后的数据,X是原始数据,X_mean是原始数据的均值,X_std是原始数据的标准差。 以下是一个使用标准差标准化处理数据的示例代码: ```python from sklearn.preprocessing import StandardScaler data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]] scaler = StandardScaler() scaled_data = scaler.fit_transform(data) print(scaled_data) ``` 输出结果为: ``` [[-1.22474487 -1.22474487 -1.22474487] [ 0. 0. 0. ] [ 1.22474487 1.22474487 1.22474487]] ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值