LTP模型
- 官网
- 源码
- LTP提供包括中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注等丰富、 高效、精准的自然语言处理技术。
- LTP模型默认提取的实体类型是:人名,机构,地名。如果实体提取不出来,则关系也不会提取出来
pyltp
- pyltp 是 LTP 的 Python 封装,pyltp 是哈工大自然语言工作组推出的一款基于Python 封装的自然语言处理工具,提供了分词,词性标注,命名实体识别,依存句法分析,语义角色标注的功能。
- 目前pyltp仅支持到python3.8,版本更高则安装失败。
pip3 install pyltp
开放域文本关系抽取
"美国作家XXX访问韩国,并在首尔大学发表演讲" 从这句中提取的关系实体如下:
(美国, 作家, XXX)
(XXX, 访问, 韩国)
(XXX, 发表演讲, 首尔大学)