数据集:西瓜书书上西瓜数据集2.0
#统计标签出现的次数
def get_counts(data):
total=len(data)
results={}
for d in data:
results[d[0]]=results.get(d[0],0)+1
return results, total
运行结果:
get_counts(data)
Out[27]: ({'色': 1}, 17)
get_counts(data['色泽'])
Out[28]: ({'青': 1}, 17)
#统计标签出现的次数
def get_counts(data):
total=len(data)
results={}
for d in data:
results[d[0]]=results.get(d[0],0)+1
return results, total
get_counts(data)
Out[30]: ({'色': 1, '根': 1, '敲': 1, '纹': 1, '脐': 1, '触': 1, '好': 1}, 17)
get_counts(data['色泽'])
Out[31]: ({'青': 6, '乌': 6, '浅': 5}, 17)