python系列-jieba中文分词工具基本操作

一、jieba分词工具的介绍及安装方法

       jieba分词工具又叫做结巴分词,被誉为python最好的分词工具,有精确模式、全模式、搜索引擎模式三种模式。

       结巴分词库安装很简单,只需要pip install jieba即可完成

二、jieba基本操作

(1)基本步骤:打开文件-读取文件-分词-写入新文件

(2)每个分词之间用空格进行区分fw.write(' '.join(sent_list))

注意事项:jieba支持unicode、UTF-8 、GBK 编码形式,但使用GBK容易产生解码错误

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值