DataFrame中将重复字符分类转化成整型分类

最新推荐文章于 2021-11-30 16:27:10 发布

Mi_Yol

最新推荐文章于 2021-11-30 16:27:10 发布

阅读量181

点赞数

文章标签： python 机器学习 pandas

本文链接：https://blog.csdn.net/m0_52032201/article/details/118658657

版权

import pandas as pd
import numpy as np

df = pd.DataFrame(index=np.arange(0, 10, 1), columns=[0], data={0: ['S', 'Q', 'Y', 'S', 'S', 'Q', 'Y', 'S', 'Q', 'Y']})	#创建一个表
print(df)

labels = df[0].unique().tolist()
df[0] = df[0].apply(lambda x: labels.index(x))	#用apply对DataFrame里的每一个值进行处理
print(df)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Mi_Yol

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

pandas将dataframe原有的数据列名称转化为整数数值列名称(convert dataframe column labelsl into integers)

data+scenario+science+insight

03-23

1513

pandas将dataframe原有的数据列名称转化为整数数值列名称(convert dataframe column labelsl into integers)

Pandas库的DataFrame数据类型及其操作详解

共勉

12-09

1234

DataFrame ：由共同索引的一组列组成（表格类型，由索引+多条列）可以由以下几种类型创建二维ndarray对象一维ndarray，列表，字典，元组或者Series构成的字典 Series类型其他的DataFrame类型代码如下由ndarray创建 >>> import pandas as pd >>> import numpy as n...

参与评论您还未登录，请先登录后发表或查看评论

字符型转化换成整型浮点型当字符串里面有不是整型数字有小数的时候转化补了整型，得删除或者替换...

weixin_30872499的博客

08-19

df.['字段'].replace("0.", "0") 当字符串里面有不是整型数字有小数的时候转化补了整型，得删除或者替换 importpandasaspd df=pd.DataFrame([{'col1':'a','col2':'1'},{'col1':'b','col2':'2'}]) printdf.dtypes df['col2']=d...

DataFrame 数据类型转换

Tjj_1998的博客

02-12

756

https://blog.csdn.net/python_ai_road/article/details/81158376

python dataframe字段类型转换

zyq_victory的博客

10-16

2528

Dataframe中的数据类型转换 astype：理解为 as type

python 怎样将dataframe中的字符串日期转化为日期的方法

12-26

方法一:也是最简单的直接使用pd.to_datetime函数实现 data['交易时间'] = pd.to_...注意使用datetime包中后面的字符串匹配需要和原字符串的格式相同,才能转义过来,相当于yyyy-mm-dd格式的需要按照’%Y-%M-%D’来实

dataframe一列转化一个字符串_DataFrame 对其列的各种转化处理

weixin_30119469的博客

01-26

3832

前置Oracle中INSTR的用法：INSTR(源字符串, 要查找的字符串, 从第几个字符开始, 要找到第几个匹配的序号)例如：INSTR('CORPORATE FLOOR','OR', 3, 2)中，源字符串为'CORPORATE FLOOR', 在字符串中查找'OR'，从第三个字符位置开始查找"OR"，取第三个字后第2个匹配项的位置。oracle的substr函数的用法：取得字符串中指定起始位...

Pandas 将DataFrame字符串日期转化成时间类型日期

给我一点温度

11-23

3万+

由于业务场景的需求，这张表里日期格式与其他表不匹配，而且需要把日期向后推算1天、2天等等。输入（列中数据是object格式）： date 2019-11-01 19:30 2019-11-30 19:00 # Data columns (total 1 columns): # date 2 non-null object 期望输出：列datetime：datetim...

布尔索引 DataFrame中将满足某列字符长度条件的行删除

God58991的博客

12-11

3118

不知道为啥，用pandas将文件读入DataFrame时，将前面的0自动给我删了，比如000003就直接给我转为3了，这样再做后续操作的时候肯定就会出错的嘛。比如我是打算把000003转换为00:00:03的，结果就搞不成了。不让我转，删了总行了吧，反正这个也是无效信息。就考虑根据列中值的字符串长度，进行行的删除。首先想到的就是布尔索引，下面先介绍下布尔索引 df=df[逻辑表达式取反] 以...

pandas学习笔记—dataframe中的数据类型和相互转换

sunmingyang1987的博客

05-17

6729

常见的dataframe中的数据类型包括以下： Data type Description datetime64[ns] 这应该是numpy中的一种时间数据类型 str 字符类型 object 一种通用的数据类型，在没有明确指定类型下，所有数据都可认为是object类型 bool_ Boolean (True or False) stored as a byte int_ Default integer type (same as C long; normally either in

pandas 之unique()函数与nunique()函数区别

feizxiang3的专栏

06-23

9万+

很多功能函数自己试一试就全知道了，开始看别人的代码一直不太清楚两者的区别，总是模糊的以为它俩是一样的，是获取唯一值。其实从名字就能看出区别： unique()是以数组形式（numpy.ndarray）返回列的所有唯一值（特征的所有唯一值） nunique()Return number of unique elements in the object.即返回的是唯一值的个数例如： ...

python | pandas：unique函数

黄佳俊的博客

11-30

5564

作用：unique()函数用于获取Series对象的唯一值。唯一性按出现顺序返回。基于哈希表的唯一，因此不排序语法：Series.unique(self) 返回：ndarray 或 ExtensionArray作为 NumPy 数组返回的唯一值。注意：以 NumPy 数组的形式返回唯一值。如果是扩展数组支持的系列，则返回该类型的新 ExtensionArray，其中仅包含唯一值。这包括分类的时期带时区的日期时间间隔疏整数NA Examples In[1]...

python pandas dataframe 去重函数

热门推荐

张某人ER的技术博客 ==学习&&分享==

08-27

16万+

python pandas dataframe 去重函数

Python之DataFrame常用方法小结

libh的博客

11-19

7万+

【Series】性质：一维数组对象，类似NumPy 的一维array。（除了包含一组数据还包含一组索引，所以可以把它理解为一组带索引的数组。） obj = Series([1,2,3,4], index = ['a', 'b', 'c', 'd']) # 通过 index 参数显示指定索引 obj.index、obj.values # 单独获取 Series 对象的索引或...

pandas的dataframe如何更改数据类型？

Python_Ai_Road的博客

07-22

16万+

pandas的dataframe数据类型转换在使用pandas库进行数据分析时，有时候会需要将object类型转换成数值类型(float,int)，那么如何做呢？主要有以下三种方法：创建时指定类型，df.astype强制类型转换，以及使用pd.to_numeric() 转换成适当数值类型。一，创建时指定类型二，使用df.astype()强制类型转换三，...

python dataframe astype 字段类型转换

chinacmt的博客

08-17

13万+

使用astype实现dataframe字段类型转换# -*- coding: UTF-8 -*- import pandas as pd df = pd.DataFrame([{'col1':'a', 'col2':'1'}, {'col1':'b', 'col2':'2'}])print df.dtypesdf['col2'] = df['col2'].astype('int') print '-

python的DataFrame数据类型

qq_43662627的博客

08-27

8433

#DataFrame数据类型适用高维数组 index行索引 cloumns 列索引 d = pd.DataFrame(np.arange(36).reshape(6,6),index = list(string.ascii_uppercase[:6]), columns=list(string.ascii_uppercase[:6])) #数据维度 d.ndim #数据值 d.values #矩阵形状 d.shape #前几行 d.head(1) #后几行 d.tail(1) #矩阵概述 d.de

Python DataFrame按条件筛选相同元素或字符串

Geek_的博客

08-02

9153

这几天在处理数据，其中有遇到需要统计相同用户的某些数据，一开始采用直接暴力匹配，时间复杂度虽然为O(n^2)，但因为数据量太多，判断条件花销较大，因而处理的非常慢。而后又将数据先排序，并设置条件判断，但这样越到后面处理速度会越慢，因为是从头开始遍历，当遇到没有的元素时，就会遍历一遍全部数据，这样的花销太大了。如下所示，因为排了序，所以相关的数据一定是在某个区间，因此当匹配到这个区间后，再遇到其他非区间内的值就可以直接跳出，但这种只对前面的数据处理有些许提升。 for j in temp.index

R语言dataframe数据列格式转换（从整型integer转化为浮点型float）

data+scenario+science+insight

10-01

3888

R语言dataframe数据列格式转换（从整型integer转化为浮点型float）目录 R语言dataframe数据列格式转换（从整型integer转化为浮点型float） #仿真数据生成（dataframe） #dataframe数据列格式转换（从整型integer到浮点型float） #基于dplyr+magrittr的数据列格式转换方案 #仿真数据生成（dataframe） ## generate data set.seed(1L); N <- 3L; t.

dataframe某列字符串转化为浮点数