pandas对字段进行唯一值编号---ngroup(), rank(), LabelEncoder()方法

怎么又出bug 了

已于 2023-12-03 21:09:14 修改

阅读量5.2k

点赞数 1

文章标签： pandas python

于 2023-12-03 20:29:42 首次发布

本文链接：https://blog.csdn.net/m0_61432650/article/details/134769624

版权

解决问题描述：如某一字段中有n个用户，而我们要用数字1到n（要从0开始直接减1即可）表示这n个用户，如果原来的这个用户字段以字符表示或者用户数字编号不连续，则需要重新编码，效果如下：

1. df.groupby().ngroup() 方法（编码从0开始），以下方法结果一致，不再贴结果图

import pandas as pd
df=pd.read_excel(path,sheet_name=0)
users_id = df.groupby('用户').ngroup()
df['编号'] = users_id+1
df

2. df.rank()方法（编码从1开始）

import pandas as pd
df=pd.read_excel(path,sheet_name=0)
users_id = df['用户'].rank(method='dense')
df['编号'] = users_id
df

3. sklearn.preprocessing.LabelEncoder() 方法（编码从0开始）

from sklearn.preprocessing import LabelEncoder
scale = LabelEncoder()
users_id = scale.fit_transform(df['用户'])
df['编号'] = users_id+1
df

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

怎么又出bug 了

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

利用PythonPandas进行数据预处理-数据清洗

02-24

Python内置的None值也会被当作NA处理处理NA的方法有四种：dropna,fillna,isnull,notnullis(not)null，这一对方法对对象做出元素级的应用，然后返回一个布尔型数组，一般可用于布尔型索引。dropna，对于一个Series，...

python中分组排序--groupby(),rank()

baidu_38409988的博客

10-21

3万+

1.python 中分组统计 1.1按性别统计出年龄最大，最小，平均值 import pandas as pd df = pd.read_excel(r'./data.xlsx') print(df) ages = df.groupby(['gender'])['age'] ages_min = ages.min() ages_max = ages.max() ages_mean = a...

1 条评论您还未登录，请先登录后发表或查看评论

Pandas学习笔记3——分组

qq_42662568的博客

04-26

716

Task03：分组（2天） Pandas基础关于分组groupby函数聚合、过滤和变换聚合（Aggregation）过滤（Filteration）变换（Transformation）apply练习练习一练习二参考内容关于分组对数据集进行分类，然后方便对每一组的数据进行统计分析。分组运算过程：split（分割）、apply（应用）、combine（合并）。切割：根据什么数据进行分组；应用...

Pandas中的 rank() 函数和 groupby 的 rank() 函数用法

Matrix_cc的博客

02-28

1万+

一、pandas中的rank()函数首先随机初始化一组数，然后 data = pd.Series([1,2,3,4,5]) print(data) data = data.rank() print(data) 这里的rank()函数打印出来虽然和原数组没区别，但是这里rank表示的是次序，所以这里的1.0，2.0表示的是第一名和第二名如果有重复值的话 data = pd.Series([1,1,2,2,3,3,4,4,5]) print(data) data = data.rank()

pandas group by + rank 求在分组内的百分位、最接近某百分位的行

Michael是个半路程序员

01-10

1196

分组后，使用 rank。

Pandas怎样实现groupby分组统计

xiaoliu的博客

05-10

1万+

一、如何实现分组统计 groupby：先对数据分组，然后在每个分组上应用聚合函数、转换函数通过三个实例来了解pandas是如何实现分组统计的一、分组使用聚合函数做数据统计二、遍历groupby的结果理解执行流程三、实例分组探索天气数据导入数据 import pandas as pd import numpy as np # 加上这一句，能在jupyter notebook展示matplot图表 #%matplotlib inline df = pd.DataFrame({'A': ['foo',

pandas使用get_dummies进行one-hot编码的方法

12-24

使用pandas可以很方便的对离散型特征进行one-hot编码 import pandas as pd df = pd.DataFrame([ ['green', 'M', 10.1, 'class1'], ['red', 'L', 13.5, 'class2'], ['blue', 'XL', 15.3, 'class

pandas-0.22.0-cp36-cp36m-win32.whl

03-30

标题中的“pandas-0.22.0-cp36-cp36m-win32.whl”指的是一个特定版本的Pandas库的安装文件，适用于Python 3.6环境，并且是针对Windows 32位系统的。Pandas是一个在Python编程语言中广泛使用的数据分析工具，它提供了...

pandas-0.22.0-cp35-cp35m-win32.whl

最新发布

03-30

标题中的"pandas-0.22.0-cp35-cp35m-win32.whl"是一个针对Python 3.5（cp35）编译的，适用于Windows 32位系统（win32）的Pandas库的特定版本——0.22.0的预编译二进制文件。 Pandas的核心组件包括DataFrame和Series...

pandas 对一列做变换，手工版的labelEncoder 和 labelEncoder

数据挖掘爱好者

05-03

1717

import pandas as pd df = pd.DataFrame({"key": ["aa", "bb", "cc"]}) dict = {"aa": 1, "bb": 3, "cc": 2} df_map = df["key"].map(dict) print("raw:\n", df.head()) print("mapped:\n", df_map) raw: ...

pandas-组操作-拆分-应用-组合（groupby）（五）

qq_14815199的博客

10-29

177

对分组数据的某些操作可能不适合聚合或转换类别。或者，您可能只是希望 GroupBy 推断如何组合结果。对于这些，使用 apply 函数，它可以在许多标准用例中替代聚合和转换。然而， apply 可以处理一些特殊的用例 1. apply()函数的基本用法： 2.返回结果的维度也可以改变： 3.apply 在 Series 可以对应用函数的返回值进行操作，这本身就是一个系列，并且可将结果向上转换为 DataFrame： 4.要查看组的顺序（与 cumcount 给出的组内行的顺序相...

pandas对每一列数据进行标签编码

全栈川川

03-23

924

pandas标签编码

pandas中groupby分组后数据调用

kunne806的博客

03-18

1836

pandas中groupby,ngroup,unique,round,get_group,groups组合运用

pandas的排序、分组groupby及cumsum累计求和

种麦南山下的博客

11-05

1万+

1、生成一列sum_age 对age 进行累加 df['sum_age'] = df['age'].cumsum() print(df) 2、生成一列sum_age_new 按照 gender和is_good 对age进行累加 df['sum_age_new'] = df.groupby(['gender','is_good'])['age'].cumsum() print(df) 3、根据不同的性别对年龄进行排序 df['rank_g'] = df.groupby(['gend..

python labelencoder_python – 适合Pandas df的LabelEncoder顺序

weixin_39690097的博客

12-08

536

我在大熊猫df的一个专栏上安装scikit-learnLabelEncoder.如何确定遇到的字符串映射到整数的顺序？这是确定性的吗？更重要的是,我可以指定此订单吗？import pandas as pdfrom sklearn import preprocessingdf = pd.DataFrame(data=["first", "second", "third", "fourth"], co...

讲解python中groupby()的应用及groupby案例分析

weixin_46713695的博客

07-09

8482

讲解python中groupby()的应用

pandas之groupby函数

TSzero的博客

04-04

1万+

sql中的分组语句group by很重要，pandas中也有类似的分组函数，即groupby，本文就主要介绍下它的用法。

pandas分组统计 - groupby功能

u010199356的博客

01-05

3万+

数据分组分组统计 - groupby功能 ① 根据某些条件将数据拆分成组 ② 对每个组独立应用函数 ③ 将结果合并到一个数据结构中 Dataframe在行（axis=0）或列（axis=1）上进行分组，将一个函数应用到各个分组并产生一个新值，然后函数执行结果被合并到最终的结果对象中。 df.groupby(by=None, axis=0, level=None, as_index=True, s...

pandas之分组groupby()的使用整理与总结