一、数据处理目标
有一个excel类型或者说dataframe类型的二维表格,需要将其中一列的数据分割出来多个,然后对分割出来的数据进行统计分析。比如,有一个电影类型的数据如下:
希望最后统计出各个类型的电影的数量和占比。比如,科幻类型的电影有几部,冒险类型的电影有几部,分别占总电影数量的百分之几等等。
二、代码实现
1、先将数据转为dataframe格式的数据。如果你的数据是excel格式的,则读取出来,我这里为了演示,数据只直接写死的。
import pandas as pd
df = pd.DataFrame([['流浪地球2','科幻|冒险|灾难',8.3],
['肖申克的救赎','剧情|犯罪',9.7],
['银河护卫队3