![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/e74ee5434ea9b5700f078a0931dc950d.png)
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/1d86b8f69cdbd2d916308bebcde6fbed.png)
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/b8162d91e45955fd90245623f727769c.png)
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/9b298310bbddda8a43efbd26f4efe904.png)
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/fb8a0007957bae1e02fd2d489bfdf91f.png)
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/31226c6e4a1bbe17a7dd5cfdc0673515.png)
上图缺点:参数太多,中文语料库匮乏
注意力机制,相当于给每一个词赋予一个权重,权重越大的越重要。
官网:https://huggingface.co/
bert的缺点:神经元太多,较慢。
LTP
如果只是需要做词性的识别,那么用LTP就可以了,由哈工大自主研发。
主页:http://ltp.ai/index.html
目前python主要用LTP,目前已经发展到4.0的版本。
牛刀小试
在最后一个章节,就用LTP完成词性标注、包括分词,最后再把它整合成图谱,通过python自动插入到xxx中去,完成这么一系列的操作,
from ltp import LTP
ltp = LTP()
result = ltp.pipeline(["他叫汤姆去拿外衣。"], tasks=["cws", "pos"])
print(result.cws)
print(result.pos)
输出:
[['他', '叫', '汤姆', '去', '拿', '外衣', '。']]
[['r', 'v', 'nh', 'v', 'v', 'n', 'wp']]