Python对数据进行量纲化处理

dltan

已于 2024-07-17 20:56:12 修改

阅读量4k

点赞数

分类专栏：笔记 Python 数据分析文章标签： python 开发语言

于 2019-07-05 21:20:19 首次发布

本文链接：https://blog.csdn.net/tandelin/article/details/94766246

版权

笔记同时被 3 个专栏收录

172 篇文章 15 订阅

订阅专栏

数据分析

81 篇文章 2 订阅

订阅专栏

Python

78 篇文章 9 订阅

订阅专栏

数据集的训练集和测试集划分

from sklearn.model_selection import train_test_split

patientdata为数据集

traindata, testdata = train_test_split(patientdata, test_size = 0.1)

数据标准化减小量纲的影响

import numpy as np
arr_mean = np.mean(patientdata) #求均值
arr_std = np.std(patientdata,ddof=1) #求标准差
newdata=(patientdata-arr_mean )/arr_std # 进行整体标准化

单独提取出Y,其余默认为X

Y=newdata['住院天数']
X=newdata.drop('住院天数',axis=1)

微信：realtimedata

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

dltan

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

100天精通Python（数据分析篇）——第75天：Pandas数据预处理之数据标准化

努力让自己发光，对的人才能迎着光而来

02-13

1万+

专栏导读 1. 数据标准化是什么？ 2. 数据标准化的作用 3. 数据标准化的方法 4. 离差标准化 5. 标准差标准化 6. 小数定标标准化

#第27篇分享：数据无量纲化（python语言：sklearn 预处理及特征工程）（3）

weixin_46008828的博客

03-07

2374

4.数据无量纲化：数据预处理，提升算法的准确度： a.无量纲化（nondimensionalize 或者dimensionless）：是指通过一个合适的变量替代，就是通过计算，将数据转变为更适合模型计算的数值，经过实践发现无量纲化后确实会加快算法速度及提升准确度。 b.机器学习的特点：是数据训练之前的数据需要人工处理一下，因为sklearn模型是不接受字符串类型的数据，我们需要把字符串等类型数据统一转换为模型可识别的数值类型，比如对三分类变量用[0，1，2]代替； c.我们想提升模型的准确度:仅仅把字符串转

1 条评论您还未登录，请先登录后发表或查看评论

Python 标准库

十亿萝莉的夢

04-16

784

吸收点营养： Python 语言参考描述了 Python 语言的具体语法和语义，这份库参考则介绍了与 Python 一同发行的标准库。它还描述了通常包含在 Python 发行版中的一些可选组件。 Python 标准库非常庞大，所提供的组件涉及范围十分广泛，正如以下内容目录所显示的。这个库包含了多个内置模块 (以 C 编写)，Python 程序员必须依靠它们来实现系统级功能，例如文件 I/O，...

数据预处理（去量钢化）的四大方法与python实现

weixin_42532898的博客

08-28

1453

做数据分析，尤其是数据建模，一半的时间都会花费在数据预处理上。但不进行预处理又不可行，因为不处理就不能很好地进行数据压缩和可视化，也不能满足模型对数据的要求。数据预处理重要又费时，如何提高数据预处理的效率呢？数据去量钢化预处理四大方法来了， python帮你轻松实现。 01.去量钢化四大方法标准化（StandardScaler） StandardScaler使每个特征的平均值为0，方差为1。优点是确保每一个特征都在同一个数量级上，缺点是不能保证每个特征的最大值和最小值。鲁棒标量化（RobustS

【Python】数据分析.pandas数据预处理.标准化数据

懂得一千零一种,赋予你失败的方法！

08-10

7656

Python----数据分析-pandas数据预处理.标准化数据不同特征之间往往具有不同的量纲，由此所造成的数值间的差异可能很大，在涉及空间距离计算或梯度下降法等情况的时候不对其进行处理会影响到数据分析结果的准确性。为了消除特征之间的量纲和取值范围差异可能会造成的影响，需对数据进行标准化处理，也可以称为规范化处理。目录：一、离差标准化数据二、标准差标准化数据三、小数定标标准化数据一、离差标准化数据离差标准化是对原始数据的一种线性变换，结果是将原始数据的数值映射到[0，1]区间上。 X∗

相似理论和量纲分析ppt

05-28

流体力学的研究方法中实验研究既是理论分析的依据，同时也是检验理论的准绳，具有很重要的作用。本章将探讨其理论基础：相似理论量纲分析

详解python实现数据归一化处理的方式：（0,1）标准化

09-19

# 对每一行数据进行归一化处理 for i in range(data.shape[0]): norm_data[i, :] = (data[i, :] - min_vals) / ranges return norm_data, ranges, min_vals ``` 3. 创建一个数据矩阵并应用归一化函数： ```...

python数据预处理之数据标准化的几种处理方式

09-19

Python数据预处理是数据分析流程中的关键步骤，其中数据标准化是一个重要的环节。标准化是将不同尺度、单位或分布形态的数据转化为统一格式的过程，以便更好地进行比较和分析。在Python中，有多种方法可以实现数据...

4种数据去量纲化方法—标准化、归一化、正则化

MollyWangRan的博客

08-02

7576

对正项序列进行变换，原始序列中的每一个值比上所有值之和。将数据缩放到（0,1）范围内。首先计算出全体数据x的均值µ与标准差σ，然后将每个x带入公式进行标准化。主要目的将不同量级的数据统一转化为同一个量级。L2正则化，将每个样本缩放到单位范数，依照特征矩阵的行处理。将数据缩放到（0,1）范围内，且不改变数据的分布形状。用python对数据进行z-score标准化。用python对数据进行min-max标准化。即每行都转化为“单位向量”，会改变分布形态。用python对数据进行正则化。...

如何基于python实现归一化处理

12-23

　不同评价指标往往具有不同的量纲和量纲单位，这样的情况会影响到数据分析的结果，为了消除指标之间的量纲影响，需要进行数据标准化处理，以解决数据指标之间的可比性。其具体针对的是奇异样本数据，奇异样本数据指...

报文通讯中量纲的作用

C++初学者

07-11

369

举例说明，假如要发送一个特别大的数字，但是所给的字节不够用就需要通过量纲的方式来处理，如果数字过小，加上电脑的处理误差，为了使数字更加准确，用量纲先放大，再转小；总之，量纲是为了：使数据传输的更加准确 ...

量纲分析方法

热门推荐

yu132563的专栏

05-31

2万+

为了能够应用数学来描述物理对象，我们需要对其定量化。物理对象的定量化需要有单位和数值，单位是作为度量标准的某个物理量。被测物理量的数值大小不仅取决于其本身，而且取决于所选用的单位。例如为了描述一块地的范围，需要确定其面积的单位和数值的大小。我们可以说这是块大小为 1 平方公里的地，也可以说这是块大小为 1000000 平方米的地。离开了单位，仅根据数值我们无法判断一块地的大小。单位的选取往...

【20180904】【查漏补缺】量纲分析法—Pi定理（Buckingham定理）

诗小葵的博客

09-04

8490

（参考：点击此处查看，介绍得很详细呢！） π定理的解题步骤: (1)确定关系式：根据对所研究的现象的认识，确定影响这个现象的各个物理量及其关系式: (2)确定基本量：从n个物理量中选取所包含的m个基本物理量作为基本量纲的代表，一般取m=3。在管流中，一般选d，v，ρ三个作基本变量，而在明渠流中，则常选用H，v，ρ。 (3)确定π数的个数N(π)=(n-m)，并写出其余物理量与基本物理量...

无量纲量和有量纲量

lcdxshengpeng的博客

09-20

1万+

物理量按照其属性分为两类：1.物理量的大小与度量所选用的单位有关，称为有量纲量，例如，时间、长度、质量、速度、力、能量等。2.物理量的大小与度量所选的单位无关，称为无量纲量，例如角度、增益、两个长度之比等。 ...

无量纲化

醉糊涂仙的博客

07-25

1万+

1,无量纲化使不同规格的数据转换到同一规格。 2,常见的无量纲化方法有标准化和区间缩放法。 2.1**标准化**的前提是特征值服从正态分布，标准化后，其转换成标准正态分布。　　标准化需要计算特征的均值和标准差，即正态分布标准化,公式表达为：　　　　使用preproccessing库的StandardScaler类对数据进行标准化的代码如下： from sklearn.datase...

使用python进行公式的计算

Wzongming的博客

03-26

4936

# coding: utf-8 from sympy import * import numpy as np from pynverse import inversefunc # 定义我们的符号 m = symbols('m') n = symbols('n') e = symbols('e') Q = symbols('Q') K = symbols('K') r = symbols('r') # 定义等式，右边要等于0 eq = Q - ((m * (n + 1) * (1 + e**2) * (r.

Python划分训练集数据并进行量纲处理

dltan

06-29

1716

读取数据 data = pd.read_csv('C://Users//TD//Desktop//hosptdata.csv') data1 = pd.read_csv('C://Users//TD//Desktop//adjestdata.csv') # 纯数值数据数据归一化处理（1）最小-最大规范化 newdata=(data1 - data1.min())/(data1.max() ...

机器学习学习笔记（3）——量纲与无量纲，标准化、归一化、正则化

LiQZ的博客

10-30

7197

量纲、无量纲，标准化、归一化、正则化是我百度了很多次都不进脑子的知识，所以我决定还是放在博客上面。不过鉴于我查阅了很多资料，说是有许多的坑，所以我也不清楚我的理解和解释是否是坑，具体的就留给各位来帮忙评判了！目录1 量纲与无量纲1.1 量纲1.2 无量纲2 标准化3 归一化4 正则化5 总结6 参考 1 量纲与无量纲 1.1 量纲量纲我觉得最重要的一句话是：物理量的大小与单位有关。从这句话我们来思考下最核心的两个单词：大小、单位。就是说量纲是有两部分组成：数、单位。就比如1块钱和1分钱，就是两个.

python对数据进行归一化并画出zscore图