初步了解中文NLP工具jieba和LTP--分词+词性标注功能

爱挠静香的下巴

于 2021-12-22 10:29:12 发布

阅读量957

点赞数 1

分类专栏： NLP学习笔记文章标签：自然语言处理人工智能 nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zzpl139/article/details/122078628

版权

NLP学习笔记专栏收录该内容

9 篇文章 2 订阅

订阅专栏

**

1.jieba分词及及词性标注功能

**

# -*- coding: utf-8 -*-
# @Time : 2021/12/22 9:28
# @Author : hp
import jieba
import jieba.posseg as pseg
#默认精确模式
txt = "小明来到了浙江省杭州市滨江区星民地铁站。他先坐6号线到奥体中心，再转乘7号线。坐了好几站，小明才到家。"
seg_list1 = jieba.cut(txt)
print("分词结果：%s"%",".join(seg_list1))
#词性
seg_list2 = pseg.cut(txt)
for u,v in seg_list2:
    print(u,'——',v)

结果：
在这里插入图片描述

2.LTP工具分词及词性标注

# -*- coding: utf-8 -*-
# @Time : 2021/12/21 21:51
# @Author : hp
from ltp import LTP
#默认加载small模型,首次加载自动下载，大小为164M
ltp = LTP()
#分句功能
sentence = ltp.sent_split(["小明来到了浙江省杭州市滨江区星民地铁站。他先坐6号线到奥体中心，再转乘7号线。坐了好几站，小明才到家。"])
print("分句结果：%s"%sentence)
#分词功能
# 结果使用segment进行访问，hidden用于访问每个词的隐藏层向量
segment, hidden = ltp.seg(sentence)
print("分词结果：%s"%segment)
#词性标注
pos_tags = ltp.pos(hidden)
print("对应词性：%s"%pos_tags)

结果输出：
在这里插入图片描述

爱挠静香的下巴

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
初步了解中文NLP工具jieba和LTP--分词+词性标注功能

初步了解中文NLP工具jieba和LTP--分词+词性标注功能
复制链接

扫一扫

专栏目录

爱挠静香的下巴 CSDN认证博客专家 CSDN认证企业博客

码龄4年

人工智能领域新星创作者

63: 原创

9374: 周排名

158万+: 总排名

15万+: 访问

: 等级

958: 积分

9373: 粉丝

197: 获赞

86: 评论

1102: 收藏

私信

关注

热门文章

分类专栏

最新评论

LSTM介绍
weixin_70466112: 这是那篇文章呀
训练自己的中文word2vec（词向量）--skip-gram方法
weixin_41068476: 请问下训练过程中，loss没有明显减少，是样本太少了吗？还是已经训练好了？
R3：基于lstm的天气预测
薛云豪: 这个是lstm模型预测么？
TextCNN新闻真假分类-pytorch版本
大地之灯: 感谢大佬学到了
联邦学习框架Fate使用记录（三）：Fate1.8-a集群服务使用记录
xueshenghu: 大神，我在做模型加载得时候提示： flow model load -c fateflow/examples/model/publish_load_model.json 提示错误： retcode": 100, "retmsg": "<_Rendezvous of RPC that terminated with:\n\tstatus = StatusCode.UNAVAILABLE\n\tdetails = \"failed to connect to all addresses\"\n\tdebug_error_string = \"{\"created\":\"@1715582018.755603504\",\"description\":\"Failed to pick subchannel\",\"file\":\"src/core/ext/filters/client_channel/client_channel.cc\",\"file_line\":3876,\"referenced_errors\":[{\"created\":\"@1715582018.755599097\",\"description\":\"failed to connect to all addresses\",\"file\":\"src/core/ext/filters/client_channel/lb_policy/pick_first/pick_first.cc\",\"file_line\":395,\"grpc_status\":14}]}\"\n>" 请指点一下，谢谢！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

爱挠静香的下巴 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。