python入门day12(jieba库下载及其使用)
python入门day12(jieba库下载及其使用)
1.jieba库的在安装:jieba是python计算生态中非常优秀的中文分词第三方库,因此我们需要进行额外的安装来得到并使用jieba库,windows环境下,我们使用win + R键,然后在对话框中输入cmd打开命令行,如下图所示,在命令行中我们输入pip install jieba来进行jieba库的安装。成功安装之后我们可以看到下面的提示,显示您已经成功安装jieba库。
2.jieba库的原理:jieba的分词是依靠中文词库来进行计算,计算的内容是汉字之间关联成一个词语的概率,他将概率较大的就认为是一个词语;除了它自带的分词之外,用户也可以向jieba添加自定义的词语。
3.jieba库的三种模式:精确模式,搜索引擎模式、全模式;
&&&精确模式就是将文本精确地切分成若干个中文单词,且这些单词可以经过组合,精确地还原为文本,其中不存在冗余单词。正是因为精确模式的特性,他也因此成