中文分词工具

jieba

import jieba
import re

sentence = '叶子本是肩并肩密密地挨着,这便宛然有了一道凝碧的波痕。叶子底下是脉脉的流水,遮住了,不能见一些颜色。'
sentence = re.sub('[,。?!、]', '', sentence)
result = list(jieba.cut(sentence))
print(result)
# ['叶子', '本是', '肩并肩', '密密', '地', '挨着', '这', '便', '宛然', '有', '了', '一道', '凝碧', '的', '波痕', '叶子', '底下', '是', '脉脉', '的', '流水', '遮住', '了', '不能', '见', '一些', '颜色']

thulac

import thulac
import re

sentence = '叶子本是肩并肩密密地挨着,这便宛然有了一道凝碧的波痕。叶子底下是脉脉的流水,遮住了,不能见一些颜色。'
sentence = re.sub('[,。?!、]', '', sentence)

thu = thulac.thulac(seg_only=True)

result = thu.cut(sentence, text=True)

print(result.split())
# ['叶子', '本', '是', '肩', '并肩', '密密', '地', '挨着', '这', '便', '宛然', '有', '了', '一', '道', '凝碧', '的', '波痕', '叶子', '底下', '是', '脉脉', '的', '流水', '遮住', '了', '不', '能', '见', '一些', '颜色']

pkuseg

import pkuseg
import re

sentence = '叶子本是肩并肩密密地挨着,这便宛然有了一道凝碧的波痕。叶子底下是脉脉的流水,遮住了,不能见一些颜色。'
sentence = re.sub('[,。?!、]', '', sentence)

pk_useg = pkuseg.pkuseg()
result = pk_useg.cut(sentence)

print(result)
# ['叶子', '本', '是', '肩并', '肩密', '密地', '挨着', '这', '便', '宛然', '有', '了', '一道', '凝碧', '的', '波痕', '叶子', '底下', '是', '脉脉', '的', '流水', '遮住', '了', '不', '能', '见', '一些', '颜色']

pyhanlp

from pyhanlp import HanLP
import re

sentence = '叶子本是肩并肩密密地挨着,这便宛然有了一道凝碧的波痕。叶子底下是脉脉的流水,遮住了,不能见一些颜色。'
sentence = re.sub('[,。?!、]', '', sentence)

result = HanLP.segment(sentence)

print([term.word for term in result])
# ['叶子本', '是', '肩并肩', '密密', '地', '挨着', '这', '便', '宛然', '有', '了', '一道', '凝碧', '的', '波痕', '叶子', '底下', '是', '脉脉', '的', '流水', '遮住', '了', '不能', '见', '一些', '颜色']

snownlp

from snownlp import SnowNLP
import re

sentence = '叶子本是肩并肩密密地挨着,这便宛然有了一道凝碧的波痕。叶子底下是脉脉的流水,遮住了,不能见一些颜色。'
sentence = re.sub('[,。?!、]', '', sentence)

result = SnowNLP(sentence)

print(result.words)
# ['叶子', '本', '是', '肩', '并肩', '密密地', '挨着', '这', '便', '宛然', '有', '了', '一', '道', '凝', '碧', '的', '波痕', '叶子', '底下', '是', '脉脉', '的', '流水', '遮住', '了', '不', '能', '见', '一些', '颜色']
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值