pandas_df.groupby()

这段博客展示了如何利用Python的Pandas库对数据框进行分组操作,包括根据`text_id`字段分组并选取特定组,查看分组后的大小,以及如何修改数据框中字段的值,将`answer`字段的数值替换为对应的标签`A`和`B`。
摘要由CSDN通过智能技术生成
import pandas as pd
df = pd.DataFrame(
{
    "text_id":[0,0,1,1],
    "question":['唐六典中说式占有哪三式?', "六壬著作有哪些?",  '汉的意思是什么?', "利玛窦何时来华?"],
    "A":["雷公式,太一式,六壬式", "《壬归》校译释论", '汉子', "清朝"],
    "B":["太史,太师,太公", "《唐六典》", "银河", "明朝"],
    "answer":[1, 1, 2, 2]
})
 text_idquestionABanswer
00唐六典中说式占有哪三式?雷公式,太一式,六壬式太史,太师,太公1
10六壬著作有哪些?《壬归》校译释论《唐六典》1
21汉的意思是什么?汉子银河2
31利玛窦何时来华?清朝明朝2

 

 

 

 

 

 

# 根据text_id字段分组
group = df.groupby("text_id")
# 取组值为0的这一组
group.get_group(0)
 text_idquestionABanswer
00唐六典中说式占有哪三式?雷公式,太一式,六壬式太史,太师,太公1
10六壬著作有哪些?《壬归》校译释论《唐六典》1

 

 

 

 

group.groups
{0: Int64Index([0, 1], dtype='int64'), 1: Int64Index([2, 3], dtype='int64')}

 

group.size()
text_id
0    2
1    2
dtype: int64
# 2
len(group)
# n是分组字段的值
for n,g in group:
    print(n)
0
1

 

# 获得一份副本,不然下面的操作容易报警告
# 对该副本的操作不会影响原对象
df_c = df.copy()

# 更改某个字段值的表示1
df_c['answer'] = df_c['answer'].replace({1:'A', 2:'B'})

# 更改某个字段值的表示2
df_c['answer'] = df_c['answer'].map({1:'A', 2:'B'})
 text_idquestionABanswer
00唐六典中说式占有哪三式?雷公式,太一式,六壬式太史,太师,太公A
10六壬著作有哪些?《壬归》校译释论《唐六典》A
21汉的意思是什么?汉子银河B
31利玛窦何时来华?清朝明朝B

 

 

 

 

 

 

参考:------链接--------

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值