最近遇到一个问题,我用Counter 统计了一下一个corpus,corpus是已经使用jieba分好的。
得到一个这样的结果。
我向还是统计一下字符长度大于等于2的吧。
这时候c是counter返回的结果。
c本身就是个字典。所以我想找出字典里key的长度大于2的。
用这个
dct_c2 = {k:v for k, v in c.items() if len(k)>1}
cs = sorted(dct_c2.items(), key = lambda x: x[1], reverse=True)
先得到dct_c2,这时候c2是一个长度大于2的字典,但是没有排序。再用sorted,按照value值排序一下。就可以得到一个近似counter的统计。
cs[0:10]
这时候就得到了一个新的字典。不过不能使用.most_common()