pandas中列方向字符统计及其合并

背景

DataFrame 中某一列为str类型,
(1)想要统计该列方向各个字符的词频
(2)将2个列的统计结果进行合并,即相同key进行相加

实施

import pandas as pd
import pdb
from collections import Counter
datas = {'column1': ['我毕业于华中科技大学', '我毕业于武汉大学'], 'column2': ['我选露娜', '夏洛特']}
df = pd.DataFrame(datas)
print(df)
column1_counter = Counter(df['column1'].str.cat())
column2_counter = Counter(df['column2'].str.cat())
print("column1_counter=", column1_counter)
print("column2_counter=", column2_counter)
# 2个 字典合并
# pdb.set_trace()
total_counter = column1_counter + column2_counter
print("total_counter=", total_counter)

运行结果如下:

      column1 column2
0  我毕业于华中科技大学    我选露娜
1    我毕业于武汉大学     夏洛特
column1_counter= Counter({'我': 2, '毕': 2, '业': 2, '于': 2, '大': 2, '学': 2, '华': 1, '中': 1, '科': 1, '技': 1, '武': 1, '汉': 1})
column2_counter= Counter({'我': 1, '选': 1, '露': 1, '娜': 1, '夏': 1, '洛': 1, '特': 1})
total_counter= Counter({'我': 3, '毕': 2, '业': 2, '于': 2, '大': 2, '学': 2, '华': 1, '中': 1, '科': 1, '技': 1, '武': 1, '汉': 1, '选': 1, '露': 1, '娜': 1, '夏': 1, '洛': 1, '特': 1})
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值