python笔记:3.2.2.7pandas数据操作_分类数据

# -*- coding: utf-8 -*-
"""
Created on Fri May 24 10:11:59 2019

@author: User
"""

import pandas as pd

student_profile=pd.DataFrame({
        'Name':['Morgan Wang','Jackie Li','Tom Ding','Erricson John','Juan Saint','Sui Mike','Li Rose'],
        'Gender':[1,0,0,1,0,1,2],
        'Blood':['A','AB','O','AB','B','O','A'],
        'Grade':[1,2,3,2,3,1,2],
        'Height':[175,180,168,170,158,183,173]        
        })

print(student_profile)

student_profile['Gender_Value']=student_profile['Gender'].astype('category')
student_profile['Gender_Value'].cat.categories=['Female','Male','Unconfirmed']

print("\n cat.categories=['Female','Male','Unconfirmed'] 挂上性别标签:")
print(student_profile)

print("\n cat.categories=['Male','Female','Unconfirmed'] 设置标签:")
student_profile['Gender_Value'].cat.categories=['Male','Female','Unconfirmed']
print(student_profile)

print("\n cut函数,数据分段:")
labels=["{0}-{1}".format(i,i+10) for i in range(160,200,10)]
student_profile['Height_Group']=pd.cut(student_profile.Height,
               range(160,205,10),
               right=False,
               labels=labels)
print(student_profile)

运行:

            Name  Gender Blood  Grade  Height
0    Morgan Wang       1     A      1     175
1      Jackie Li       0    AB      2     180
2       Tom Ding       0     O      3     168
3  Erricson John       1    AB      2     170
4     Juan Saint       0     B      3     158
5       Sui Mike       1     O      1     183
6        Li Rose       2     A      2     173

 cat.categories=['Female','Male','Unconfirmed'] 挂上性别标签:
            Name  Gender Blood  Grade  Height Gender_Value
0    Morgan Wang       1     A      1     175         Male
1      Jackie Li       0    AB      2     180       Female
2       Tom Ding       0     O      3     168       Female
3  Erricson John       1    AB      2     170         Male
4     Juan Saint       0     B      3     158       Female
5       Sui Mike       1     O      1     183         Male
6        Li Rose       2     A      2     173  Unconfirmed

 cat.categories=['Male','Female','Unconfirmed'] 设置标签:
            Name  Gender Blood  Grade  Height Gender_Value
0    Morgan Wang       1     A      1     175       Female
1      Jackie Li       0    AB      2     180         Male
2       Tom Ding       0     O      3     168         Male
3  Erricson John       1    AB      2     170       Female
4     Juan Saint       0     B      3     158         Male
5       Sui Mike       1     O      1     183       Female
6        Li Rose       2     A      2     173  Unconfirmed

 cut函数,数据分段:
            Name  Gender Blood  Grade  Height Gender_Value Height_Group
0    Morgan Wang       1     A      1     175       Female      170-180
1      Jackie Li       0    AB      2     180         Male      180-190
2       Tom Ding       0     O      3     168         Male      160-170
3  Erricson John       1    AB      2     170       Female      170-180
4     Juan Saint       0     B      3     158         Male          NaN
5       Sui Mike       1     O      1     183       Female      180-190
6        Li Rose       2     A      2     173  Unconfirmed      170-180
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值