在学习PYTHON自然语言处理这本书第一章的时候,遇到了一个问题,就是书中的代码(下图)运行出来结果不符,可以用这种方式来获得相同的效果:
>>> fdist1 = FreqDist(text1)
>>> vocabulary1 = sorted(fdist.items(), key=lambda jj:jj[1], reverse=True)
>>> s = []
>>> for i in range(50):
... s.append(vocabulary1[i][0])
...
>>> print(s)
其中,第二行代码:
sorted()是一种排序方式,fdist.items( )是待排序的对象
(key对应的函数会被前面列表中的每个元素调用,定义排序规则)
key=lambda 变量:变量[维数] 。维数可以按照自己的需要进行设置。
key=lambda jj: jj[1]:匿名函数,作用是按照每个item的item[1],进行后面的排序
reverse=True:逆序排列,即从大到小(默认为从小到大)
这样输出的就是频率从高到低的前50个词了!
后面的例子也采用这个方式就可以得出与书上相同的结论了!