数据缩放方法总结

本文介绍了数据预处理中的三种重要缩放方法:标准化(Z-Score)、属性缩放到指定范围(如0-1之间)和正则化。标准化通过去除均值和方差实现,使数据具有零均值和单位方差。范围缩放常用于增强小方差属性的稳定性,保持稀疏矩阵。正则化则用于将样本缩放到单位范数,常用于计算样本间相似性。文章还提到了sklearn库中对应的实现方法。
摘要由CSDN通过智能技术生成

 

一、标准化(Z-Score),或者去除均值和方差缩放

标准分数(standard score)也叫z分数(z-score),是一个分数与平均数的差再除以标准差的过程。用公式表示为:z=(x-μ)/σ。其中x为某一具体分数,μ为平均数,σ为标准差。

Z值的量代表着原始分数和母体平均值之间的距离,是以标准差为单位计算。在原始分数低于平均值时Z则为负数,反之则为正数。

标准分数的作用和特点:
标准分数可以回答这样一个问题:"一个给定分数距离平均数多少个标准差?"在平均数之上的分数会得到一个正的标准分数,在平均数之下的分数会得到一个负的标准分数。

标准分数是一种可以看出某分数在分布中相对位置的方法。标准分数能够真实的反应一个分数距离平均数的相对标准距离。如果我们把每一个分数都转换成标准分数,那么每一个标准分数会以标准差为单位表示一个具体分数到平均数的距离或离差。将成正态分布的数据中的原始分数转换为标准分数,我们就可以通过查阅标准分数在正态曲线下面积的表格来得知平均数与标准分数之间的面积,进而得知原始分数在数据集合中的百分等级。[1]


一个数列的各标准分数的平方和等于该数列数据的个数,并且标准分数的标准差和方差都为1。

例如:某中学高(1)班期末考试,已知语文期末考试的全班平均分为73分,标准差为7分,甲得了78分;数学期末考试的全班平均分为80分,标准差为6.5分,甲得了83分。甲哪一门考试成绩比较好?


因为两科期末考试的标准差不同,因此不能用原始分数直接比较。需要将原始分数转换成标准分数,然后进行比较。


Z(语文)=(78-73)/7=0.71 Z(数学)=(83-80)/6.5=0.46  甲的语文成绩在其整体分布中位于平均分之上0.71个标准差的地位,他的数学成绩在其整体分布中位于平均分之上0.46个标准差的地位。由此可见,甲的语文期末考试成绩优于数学期末考试成绩。

由于标准分数不仅能表明原始分数在分布中的地位,它还是以标准差为单位的等距量表,故经过把原始分数转化为标准分数,可以在不同分布的各原始分数之间进行比较。

 

特点:

(1)样本平均值为0,方差为1;

(2)区间不确定,处理后各指标的最大值、最小值不相同;

(3)对于指标值恒定的情况不适用;
(4)对于要求标准化后数据 大于0 的评价方法(如几何加权平均法)不适用。

 

实现时,有两种不同的方式:

  • 使用sklearn.preprocessing.scale()函数,可以直接将给定数据进行标准化。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

>>> from sklearn import preprocessing

>>> import numpy as np

>>> X = np.array([[ 1., -1.,  2.],

...               [ 2.,  0.,  0.],

...               [ 0.,  1., -1.]])

>>> X_scaled = preprocessing.scale(X)

 

>>> X_scaled                                         

array([[ 0.  ..., -1.22..., 

  • 6
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: ChartDirector 是一个用于创建图表和数据可视化的软件开发工具包。它提供了丰富的功能和灵活的选项,使用户能够创建各种类型的图表,并且可以对这些图表进行缩放操作。 在 ChartDirector 中,缩放是指对图表进行放大或缩小的操作。用户可以通过调整缩放参数来改变图表的大小和比例。缩放操作可以帮助用户更好地浏览和查看图表中的数据,特别是当图表中包含大量数据和细微的数据变化时。 ChartDirector 提供了多种缩放方法,其中一种常用的是通过滚动条来实现图表的缩放。用户可以通过调整滚动条的位置来改变图表的可视范围,并且可以同时在水平和垂直方向上进行缩放。另外,用户还可以使用鼠标进行拖拽操作来移动图表的显示区域。 除了滚动条和拖拽操作,ChartDirector 还支持其他的缩放功能,如通过鼠标滚轮进行缩放和通过手势操作在移动设备上进行缩放。这些功能使得用户能够以更加直观和便捷的方式对图表进行缩放操作。 总结而言,ChartDirector 提供了多种方式和方法来实现图表的缩放,用户可以根据自己的需求和喜好来选择合适的缩放方式。通过缩放,用户可以更全面、细致地观察和分析图表中的数据,从而更好地理解和利用数据。 ### 回答2: ChartDirector是一款强大的数据可视化工具,它提供了多种缩放功能,可以帮助用户更好地观察和分析图表数据。 首先,ChartDirector提供了内置的缩放功能,用户可以使用鼠标滚轮或手动拖动来缩放图表。这使得用户可以根据需要放大或缩小图表,以查看更详细或更全面的数据。 其次,ChartDirector还支持动态缩放功能。用户可以通过编程的方式控制图表的缩放。例如,用户可以定义一个按钮,点击按钮时,图表会自动缩放到指定的大小或比例。这样用户可以根据自己的需求动态地调整图表的显示。 此外,ChartDirector还支持缩放指定区域的功能。用户可以通过选择或拖动鼠标来选择一个特定的区域,然后按下缩放按钮或调用缩放方法,图表将自动缩放到所选区域。这对于用户想要查看某个特定区域的详细数据非常有用。 最后,ChartDirector还提供了自适应缩放功能。当图表的尺寸发生变化时,自适应缩放功能可以自动调整图表的大小和比例,以适应新的尺寸。这在用户需要在不同的设备或窗口大小下查看图表时非常方便。 总之,ChartDirector提供了多种实用的缩放功能,用户可以根据自己的需要来调整图表的显示,使得数据的观察和分析更加方便和灵活。 ### 回答3: ChartDirector是一个功能强大的数据可视化软件包,可用于创建各种类型的图表和图形。在ChartDirector中,可以使用缩放功能来调整图表的大小和比例。 ChartDirector提供了几种缩放图表的方法。首先,可以使用setScale方法来指定图表的缩放比例。该方法接受两个参数,分别是水平和垂直的缩放比例。通过调整这两个参数的值,可以实现对图表的放大或缩小操作。 另外,ChartDirector还提供了zoomIn和zoomOut方法,用于实现图表的逐步放大和缩小。zoomIn方法会将图表放大一定比例,而zoomOut方法则会将图表缩小一定比例。通过多次调用这两个方法,可以实现连续的放大和缩小操作。 除了手动指定缩放比例之外,ChartDirector还支持通过鼠标滚轮进行图表的缩放。只需要在图表上按住鼠标左键并滚动鼠标滚轮,就可以实现图表的实时缩放。这种方法非常直观且易于操作,可以方便地对图表进行放大和缩小。 总而言之,ChartDirector提供了多种灵活的缩放方法,可以根据需求对图表进行精确的放大和缩小操作。无论是手动指定缩放比例、逐步放大和缩小,还是通过鼠标滚轮进行实时缩放,都能够满足用户对图表显示的要求。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值