初始数据格式 数据格式如图所示,每个Keywords里面都含有多个关键词,使用分号(;)间隔开。一共有ABCDEF六个group,并且关键词有重复。 最终想要的数据格式 统计所有不重复的关键词在六个group中出现的频次。 使用R来处理 rm(list = ls()) setwd("protein/") library(xlsx) # 根据自己的数据来处理