jieba分词

最新推荐文章于 2022-09-14 08:26:13 发布

在下蔡江琪

最新推荐文章于 2022-09-14 08:26:13 发布

阅读量3k

点赞数 8

分类专栏：笔记文章标签： jieba分词

本文链接：https://blog.csdn.net/qq_41848129/article/details/96729698

版权

笔记专栏收录该内容

15 篇文章 0 订阅

订阅专栏

因为最近的项目的需求，要使用到jieba分词，所以就简单的分享一下

对的jieba几个模式的使用:

接下来是简单的操作

# 导入包
import jieba

#管理系统路径
import sys
sys.path.append("../")

# 获取自定义词典
jieba.load_userdict('data/duanxin/userdict.txt')

#导入词性标注的包
import jieba.posseg as pseg

#添加词
jieba.add_word('行窃预兆')
jieba.add_word('气定神闲')

# 删除词
jieba.del_word('hello')

#元组类型的测试数据
test_sent=(
"和深度和等候爱的诶哟广大撒好的坏读书的机会;谁都会厚度啊的哈"
"萨哈帝国画分镜给福建省覅 是否会旁边将发射光谱上方式烧饭"
"[和咯哦安静 ]很烦粉红色会苏粉丝发挥示范是否会四、是服饰"
)

# 默认分词
words=jieba.cut(test_sent)
print('/'.join(words))

print('*'*40)

#用于词性标注
result=pseg.cut(test_sent)

#使用for 循环把分出的词及其词性用/隔开 并添加空格
for w in result:
    print(w.word,'/',w.flag,',',end=' ')
print('\n'+'*'*40)

# 对英文的分割
terms=jieba.cut('dha adh d hdsahda adshjah')
print('/'.join(terms))

#对英文和汉字的分割
terms=jieba.cut('usdiaiu的埃胡德啊哈的')
print('/'.join(terms))

print('*'*40)

因为项目需求不高，所以简单的操作已经可以实现需求了，如果大家感兴趣的话可以去看看这篇文章，希望能帮助各位~

在下蔡江琪

关注

8
点赞
踩
38

收藏

觉得还不错? 一键收藏
0
评论
jieba分词

因为最近的项目的需求，要使用到jieba分词，所以就简单的分享一下对的jieba几个模式的使用:接下来是简单的操作# 导入包import jieba#管理系统路径import syssys.path.append("../")# 获取自定义词典jieba.load_userdict('data/duanxin/userdict.txt')#导入词性标注的包i...
复制链接

扫一扫

专栏目录