pandas 给数据打标签

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.randint(0,100,100), columns=['score'])

# 以所在区间作为标签。如 x=5,返回:'[0-10]'
def make_label(x, step=10):
    m = x // step
    return '[{}-{}]'.format(m * step, (m+1) * step)
    
    
#df['level'] = df['score'].map(make_label)
df['level'] = df['score'].map(lambda x:make_label(x,step=10)) # 改变区间长度为15


res = df.groupby('level').size()

print(df.head())
print(res)

转载于:https://www.cnblogs.com/hhh5460/p/5817452.html

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
pandas是一个强大的数据处理和分析库,可以用于处理和分析各种类型的数据集。 数据集可以划分为标签数据,其中标签是指数据中的一个特定列或属性,用于表示数据的类别或分类。而数据是指包含在数据集中的所有其他列或属性,用于描述标签的特征。 在pandas中,可以使用DataFrame对象来表示数据集。DataFrame是一个二维表格数据结构,其中每一列可以被看作是一个Series对象,每个Series对象都有一个名称,就是列名,这些名称可以用于标识和区分不同的列。 要划分标签数据,可以使用pandas提供的功能来选择和提取特定的列或属性。通常情况下,标签列会被单独提取出来,成为一个Series对象,而数据列则组成一个新的DataFrame对象。 例如,假设我们有一个包含学生信息的数据集,包括姓名、年龄、性别和分数等列。我们可以使用以下代码来划分标签数据: ```python import pandas as pd # 创建一个DataFrame对象表示数据集 data = pd.DataFrame({'姓名': ['张三', '李四', '王五'], '年龄': [20, 21, 22], '性别': ['男', '女', '男'], '分数': [90, 85, 95]}) # 划分标签数据 标签 = data['分数'] 数据 = data.drop('分数', axis=1) print('标签列:') print(标签) print('数据列:') print(数据) ``` 以上代码输出结果如下: ``` 标签列: 0 90 1 85 2 95 Name: 分数, dtype: int64 数据列: 姓名 年龄 性别 0 张三 20 男 1 李四 21 女 2 王五 22 男 ``` 可以看到,我们成功地将标签列(分数)和数据列(姓名、年龄和性别)分别提取出来,并将它们存储为Series对象和DataFrame对象。这样就完成了对pandas数据集的标签数据的划分。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值