HMM与LTP词性标注之LTP介绍

赵孝正

已于 2023-11-19 13:02:15 修改

阅读量145

点赞数

分类专栏： # 1. 自然语言处理&知识图谱文章标签：人工智能

于 2023-11-16 21:30:33 首次发布

本文链接：https://blog.csdn.net/weixin_46713695/article/details/134450929

版权

24 篇文章 5 订阅

订阅专栏

上图缺点：参数太多，中文语料库匮乏

注意力机制，相当于给每一个词赋予一个权重，权重越大的越重要。
官网：https://huggingface.co/
在这里插入图片描述

bert的缺点：神经元太多，较慢。

LTP

如果只是需要做词性的识别，那么用LTP就可以了，由哈工大自主研发。
在这里插入图片描述
主页：http://ltp.ai/index.html

在这里插入图片描述

在这里插入图片描述
目前python主要用LTP，目前已经发展到4.0的版本。

在最后一个章节，就用LTP完成词性标注、包括分词，最后再把它整合成图谱，通过python自动插入到xxx中去，完成这么一系列的操作，

在这里插入图片描述

from ltp import LTP

ltp = LTP()

result = ltp.pipeline(["他叫汤姆去拿外衣。"], tasks=["cws", "pos"])
print(result.cws)
print(result.pos)

输出：

[['他', '叫', '汤姆', '去', '拿', '外衣', '。']]
[['r', 'v', 'nh', 'v', 'v', 'n', 'wp']]

关注

专栏目录