有时候需要统计dataFrame里包含某一列某个元素的数量
Example
data = [['守门员','商业'],
['包子','关注'],
['小夜曲','引流'],
['Y','引流, 商业'],
['晓影','引流,关注'],
['老七','引流,下单'],
['梦醒','商业, 购买']]
tmpt = pd.DataFrame(data,columns=['名称','标签'])
此时我们想筛选标签包含商业、关注和引流的名称数量
# 新建一个dataframe
data = [['商业',0],['引流',0],['关注',0]]
biaoqian = pd.DataFrame(data,columns=['标签','人数'])
# 循环计算标签数量
for i in tmpt.index:
if tmpt.loc[i,'标签'].find('商业') != -1:
biaoqian.iloc[0,1] += 1
if tmpt.loc[i,'标签'].find('引流') != -1:
biaoqian.iloc[1,1] += 1
if tmpt.loc[i,'标签'].find('关注') != -1:
biaoqian.iloc[2,1] += 1