Pandas使用explode实现一行变多行统计

南湖渔歌

于 2022-08-06 17:53:09 发布

阅读量254

点赞数

分类专栏： M8-100 文章标签： pandas python

本文链接：https://blog.csdn.net/weixin_44976611/article/details/126198678

版权

M8-100 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

# 解决实际问题：一个字段包含多个值，怎样将这个值拆分成多行，然后实现统计：

import pandas as pd

# 实验数据：
data = pd.DataFrame({ 'Country':['China','American','Japan'],
                      'City': ['shanghai|Shenzhen|beijing','New York|shanghai|Shenzhen|beijing | Texas','Tokyo|Osaka'],
                      'GDP': ['88,89,43','123,45,46,99,123','123,63,24']
              })
data

def row_to_rows(data,col):
    
    '''一个电影有多个分类、一个人有多个喜好，需要按分类、喜好做统计
    '''
    
    data['%ss'%(col)] = data[col].map(lambda x:x.split("|"))
    data_new = data.explode('Citys')
    
    # 绘图
    %matplotlib inline
    data_new['%ss'%(col)].value_counts().plot.bar()
    
    return data_new

row_to_rows(data,'City')