1 说明:
=====
1.1 Jieba库,就是“结巴”中文分词:做最好的 Python 中文分词组件。
1.2 Jieba库的基本介绍,数据可视化wordcloud词云图和pyecharts柱状图。
1.3 写入和读取txt数据的方法复习。
2 准备:
=====
2.1 官网:
https://github.com/fxsjy/jiebahttps://pypi.org/project/jieba/
2.2 安装:
pip install jieba#本机安装sudo pip3.8 install -i https://mirrors.aliyun.com/pypi/simple jieba
2.3 环境:
华为笔记本电脑、深度deepin-linux操作系统、谷歌浏览器、python3.8和微软vscode编辑器。
===举例===
3 关键词提取:
==========
3.1 代码:
import jieba.analyse#张爱玲经典散文欣赏:爱#注意,复习字符串知识#如果是一行字符串,那么单引号、双引号、三引号均可以#如果多行显示,后面需要加,那么只能双引号和三引号,单引号不行。#同时,等号后面必须紧跟一个前引号test_text = '''有个村庄的小康之家的女孩子,生得美,有许多人来做媒,但都没有说成。那年她不过十五六岁吧,是春天的晚上,她立在后门口,手扶着桃树。她记得她穿的是一件月白的衫子。对门住的年轻人同她见过面,可是从来没有打过招呼的,他走了过来。离得不远,站定了,轻轻的说了一声:“噢,你也在这里吗?”她没有说什么,他也没有再说什么,站了一会,各自走开了。就这样就完了。后来这女人被亲眷拐子卖到他乡外县去作妻,又几次三番地被转卖,经过无数的惊险的风波,老了的时候她还记得从前那一回事,常常说起,在那