利用jieba库对李之仪的《卜算子》进行分词

最新推荐文章于 2023-05-16 15:11:15 发布

shangxianjiao

最新推荐文章于 2023-05-16 15:11:15 发布

阅读量4k

点赞数 1

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/shangxianjiao/article/details/105864309

版权

python 专栏收录该内容

25 篇文章 6 订阅

订阅专栏

利用jieba库对李之仪的《卜算子》进行分词

按照单词出现的次数从高到低排序。因为字典类型是无序的，无法排序，因此将counts转为列表类型(列表排序的知识点详见“python中列表的sort方法使用详解”)。查看排序后的结果。


import jieba
txt ='''
卜算子
【宋】李之仪
我住长江头，君住长江尾。
日日思君不见君，共饮长江水。
此水几时休，此恨何时已。
只愿君心似我心，定不负相思意。
'''
words = jieba.lcut(txt)						#精确模式
counts = {}
for word in words:							#逐一遍历每一个汉字
    counts[word] = counts.get(word,0) + 1		#计数
items = list(counts.items())					#转化为列表类型
items.sort(key=lambda x:x[1], reverse=True)		#排序
for item in items:
    print(item)

为了增强排序后结果的可读性，利用format调整输出的格式。


import jieba
txt ='''
卜算子
【宋】李之仪
我住长江头，君住长江尾。
日日思君不见君，共饮长江水。
此水几时休，此恨何时已。
只愿君心似我心，定不负相思意。
'''
words = jieba.lcut(txt)		#精确模式
counts = {}
for word in words:							#逐一遍历每一个汉字
    counts[word] = counts.get(word,0) + 1		#计数
items = list(counts.items())					#转化为列表类型
items.sort(key=lambda x:x[1], reverse=True)		#排序
for item in items:
    word,count=item
    print("{0:<10}{1:>5}".format(word,count))

shangxianjiao

关注

1
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
利用jieba库对李之仪的《卜算子》进行分词

利用jieba库对李之仪的《卜算子》进行分词按照单词出现的次数从高到低排序。因为字典类型是无序的，无法排序，因此将counts转为列表类型(列表排序的知识点详见“python中列表的sort方法使用详解”)。查看排序后的结果。import jiebatxt ='''卜算子【宋】李之仪我住长江头，君住长江尾。日日思君不见君，共饮长江水。此水几时休，此恨何时已。只愿君心似我心，定不...
复制链接

扫一扫