pandas归一化某一列_pandas 数据归一化以及行删除例程的方法

最新推荐文章于 2021-11-30 16:49:36 发布

里里Lili

最新推荐文章于 2021-11-30 16:49:36 发布

阅读量145

点赞数

文章标签： pandas归一化某一列

本文链接：https://blog.csdn.net/weixin_32561279/article/details/112818075

版权

本文介绍了如何使用Pandas库对数据进行归一化处理，将数值范围映射到-1到1之间，并展示了如何根据缺失值比例删除行。此外，还提供了处理包含字符串标签列的示例。

摘要由CSDN通过智能技术生成

#coding:utf8

import pandas as pd

import numpy as np

from pandas import Series,DataFrame

# 如果有id列，则需先删除id列再进行对应操作，最后再补上

# 统计的时候不需要用到id列,删除的时候需要考虑

# delete row

def row_del(df, num_percent, label_len = 0):

#print list(df.count(axis=1))

col_num = len(list(list(df.values)[1])) - label_len # -1为考虑带标签

if col_num<0:

print 'Error'

#print int(col_num*num_percent)

return df.dropna(axis=0, how='any', thresh=int(col_num*num_percent))

# 如果有字符串类型，则报错

# data normalization -1 to 1

# label_col: 不需考虑的类标，可以为字符串或字符串列表

# 数值类型统一到float64

def data_normalization(df, label_col = []):

lab_len = len(label_col)

print label_col

if lab_len>0:

df_temp = df.drop(label_col, axis = 1)

df_lab

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

里里Lili

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

pandas归一化某一列_机器学习笔记_2_Pandas（1）

weixin_42131443的博客

01-07

359

目录：一、Pandas数据读取二、Pandas索引与计算三、Pandas数据预处理实例四、Pandas常用预处理方法五、Pandas自定义函数————————————————一、Pandas数据读取import pandasfood_info = pandas.read_csv("food_info.csv") #读取文件print(type(food_info)) #查询文件类型# p...

pandas归一化某一列_pandas技巧汇总

weixin_35857552的博客

02-28

953

dataframe reindex和reset_index区别reset_index的作用是重新设置dataframe的index，范围为0~len(df)。df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50]})df2 = pd.DataFrame({'A': [6], 'B': [60]})print 'df\n'...

参与评论您还未登录，请先登录后发表或查看评论

pandas 删除某一行/列

weixin_43914402的博客

11-01

2万+

pandas 删除某一行/列方法1 # pandas 删除某一行/列 # 语法：DataFrame.drop(labels=None,axis=0, index=None, columns=None, inplace=False) 参数说明： labels 就是要删除的行列的名字，用列表给定 axis 默认为0，指删除行，因此删除columns时要指定axis=1； index 直接指定要删除的行 columns 直接指定要删除的列 inplace=False，默认该删除操作不改变原数据，而是返回一个

pandas对dataFrame中某一个列的数据进行处理的方法

12-23

背景：dataFrame的数据，想对某一个列做逻辑处理，生成新的列，或覆盖原有列的值下面例子中的df均为pandas.DataFrame()的数据 1、增加新列，或更改某列的值 df["列名"]=值如果值为固定的一个值，则dataFrame中该列所有值均为这个数据 2、处理某列 df["列名"]=df.apply(lambda x:方法名(x,入参2),axis=1) 说明： 1、方法名为单独的方法名，可以处理传入的x数据 2、x为每一行的数据，做为方法的入参1；x中的数据可以用【x.列名】来获取 3、入参2等为方法需要的其他参数，不需要可以不写 4、axis=1，表示每次取一行数据进

pandas 数据归一化以及行删除例程

Carl

07-23

1万+

pandas 数据归一化以及行删除例程 #coding:utf8 import pandas as pd import numpy as np from pandas import Series,DataFrame # 如果有id列，则需先删除id列再进行对应操作，最后再补上 # 统计的时候不需要用到id列,删除的时候需要考虑 # delete row def row_del(df, num_

pandas 数据归一化以及行删除例程的方法

09-19

在数据分析和机器学习中，数据预处理是至关重要的步骤，其中数据归一化和行删除是常见的处理手段。本文将详细介绍如何使用pandas库在Python中执行这些操作。首先，让我们了解一下数据归一化。数据归一化是将数据按...

Python中的数据可视化工具与方法——常用的数据分析包numpy、pandas、statistics的理解实现和可视化工具matplotlib的使用

qq_45154565的博客

10-15

6135

Python中的数据可视化工具与方法本文主要总结了： 1、本人在初学python时对常用的数据分析包numpy、pandas、statistics的学习理解以及简单的实例实现 2、可视化工具matplotlib的学习与使用使用编程软件为pycharm 一、什么是数据可视化数据可视化就是把数据从冰冷的数字转换成图形，一个好的可视化，能够带给人们不仅仅是视觉上的冲击，还能够揭示蕴含在数据中的规律和道理。 1、数据可视化的概念：狭义上的数字可视化指的是将数据用统计图表方式呈现，广义上数据可视化是

基于STM32F407四旋翼无人机---MPU6050数据处理（滑动均值滤波）（二）

qq_43046763的博客

06-07

5908

MPU6050模块是一个比较常用的一个姿态传感器，里面有三轴加速度计和三轴陀螺仪的六轴传感器模块，并可以利用DMP来直接输出姿态解算后的数据，通过IIC通信将姿态结算后的数据输出，但是看过大多数飞控中的姿态解算发现很少用DMP来做姿态解算的，因为用DMP做姿态解算会有漂移，而且收敛速度较慢，此模块自带温度传感器，这个温度传感器可不是测量机体周围环境的温度，而是像电脑中电脑管家里面经常看到的CPU温度一样，它测量的就是MPU6050此时的温度，那么这个温度有什么用呢？当MPU6050自身有温度的时候是对数据是

pandas 如何删掉第一行_pandas删除指定行详解

weixin_39956558的博客

12-19

6702

pandas删除指定行详解在处理pandas的DataFrame中，如果想像excel那样筛选，只要其中的某一行或者几行，可以使用isin()方法来实现，只需要将需要的行值以列表方式传入即可，还可传入字典，进行指定筛选。pandas.DataFrame中删除包涵特定字符串所在的行：https://www.jb51.net/article/159052.htm以上所述是小编给大家介绍的pandas删...

Python中pandas dataframe删除一行或一列：drop函数

热门推荐

海晨威

02-10

75万+

用法：DataFrame.drop(labels=None,axis=0, index=None, columns=None, inplace=False) 在这里默认：axis=0，指删除index，因此删除columns时要指定axis=1； inplace=False，默认该删除操作不改变原数据，而是返回一个执行删除操作后的新dataframe； inplace=True，则会直接在原...

python 处理行列数据集数据_数据预处理（python）

weixin_31586521的博客

01-28

2229

作为统计的一员，用python来对数据做语出这一步骤是必需的，所以接下来就来总结一下python数据预处理的步骤吧，这里就不放数据了，直接上代码，代码后都有解释，有错误的尽管提出来哈。下面是流程图：一、数据预览import pandas as pdimport numpy as npdata=pd.read_csv('path',sep=',' ,header = 0,encoding='gbk'...

pandas.DataFrame删除/选取含有特定数值的行或列

luocheng7430的博客

06-20

31万+

1.删除/选取某列含有特殊数值的行 import pandas as pd import numpy as np a=np.array([[1,2,3],[4,5,6],[7,8,9]]) df1=pd.DataFrame(a,index=['row0','row1','row2'],columns=list('ABC')) print(df1) df2=df1.copy() #删除/选取...

pandas归一化某一列_pandas归一化操作

weixin_33324007的博客

02-28

1816

归一化操作有两种1.max和min的归一化操作min-max标准化(Min-Max Normalization)返回结果0~1公式：实例：如：随机生成假数据如下df = DataFrame({"height":np.random.randint(150,190,size=50),"weight":np.random.randint(40,90,size = 50),"sex":np.random...

pandas之df使用指南

weixin_43925027的博客

03-18

2234

pandas使用指南读写、创建dataframe、基础信息获取读写 import pandas as pd #读取 day_type = pd.read_excel("./DataFile/2019工作日.xlsx"，sheet_name=0, header=0, names=None, index_col=None, usecols=None) #写入 day_type.to_excel("...

pandas小记：pandas数据规整化-缺失、冗余、替换

皮皮blog

09-22

1万+

http://blog.csdn.net/pipisorry/article/details/39482861 处理缺失数据缺失数据（missing data)在大部分数据分析应用中都很常见。pandas的设计目标之一就是让缺失数据的处理任务尽量轻松，pandas对象上的所有描述统计都排除了缺失数据。 pandas使用浮点NaN (Not a Number)表示浮点和非浮点数组中的缺失数据，...

pandas 删除指定行

htbeker的博客

03-03

9万+

在处理pandas的DataFrame中，如果想像excel那样筛选，只要其中的某一行或者几行，可以使用isin()方法来实现，只需要将需要的行值以列表方式传入即可，还可传入字典，进行指定筛选。但是如果我们只想要所有内容中不包含特定行的内容，却并没有一个isnotin()方法，经常查找之后，发现只能换种方式使用isin()来实现这个需求。pandas.DataFrame中删除包涵特定字符串所在的行...

numpy学习笔记

feverfew1的博客

11-30

1574

Numpy numpy 使用ndarray对象处理多维数组，该对象是一个快速而灵活的大数据容器一、ndarray 相同类型的“items”的集合 import numpy as np score=np.array([1,2,3]，dtype='float') # 转换为array格式,创建数组时指定类型 print("数据维度的元组",score.shape) print('数据维数',score.ndim) print('数据中元素个数',score.size) print('一个数据元素的长度',sc

pandas数据归一化方法

重剑无锋博客

05-21

8380

归一化操作有两种 1.max和min的归一化操作 min-max标准化（Min-Max Normalization）返回结果0~1 公式：对数据进行归一化操作 df = (df-df.min())/(df.max()-df.min()) 2.Z-score标准化方法方法：返回结果：返回的结果是标准值为1，平均值为0，标准的正态分布数据实例如下： df2 = (df-df.mean())/df.std() #df数据减去df平均值，再出...

df命令用法举例

qq646748739的专栏

07-24

6115

linux中df命令的功能是用来检查linux服务器的文件系统的磁盘空间占用情况。可以利用该命令来获取硬盘被占用了多少空间，目前还剩下多少空间等信息。 1.命令格式：df [选项] [文件] 2.命令功能：显示指定磁盘文件的可用空间。如果没有文件名被指定，则所有当前被挂载的文件系统的可用空间将被显示。默认情况下，磁盘空间将以1KB为单位进行显示，除非环境变量POSIXLY_COR...

对pandas数据表中的某一列的离散数据进行归一化处理