NLP 的应用

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/chuchus/article/details/77431507

1.中文分词

中文分词,Word Segmentation, 指的是将汉字序列切分成词序列。
在汉语中,, 是承载语义的最基本的单元。分词是信息检索、文本分类、情感分析等多项中文自然语言处理任务的基础。

2.词性标注

Part-of-speech Tagging, POS.
给句子中每个词标注一个词性。 这里的词性类别可能是名词、动词、形容词或其他。
下面是一个词性标注的例子。 其中,v代表动词、n代表名词、c代表连词、d代表副词、wp代表标点符号。

国务院/ni 总理/n 李克强/nh 调研/v 上海/ns 外高桥/ns 时/n 提出/v ,/wp 支持/v 上海/ns 积极/a 探索/v 新/a 机制/n 。/wp

3.句法解析

4.命名实体识别

用来识别语料中专有名词未登录词的成词情况.
未登录词: 即没有被收录在分词词表中但必须切分出来的词,包括各类专有名词(人名、地名、企业名等)、缩写词、新增词汇等等.
一个例子见下.
国务院 (机构名) 总理 李克强 (人名) 调研上海外高桥 (地名) 时提出,支持上海 (地名) 积极探索新机制。

5.情感分析

6.自动问答

7. 语义依存分析

Semantic Dependency Parsing.

8.语义角色标注

参考

哈工大, 语言云简介

展开阅读全文

没有更多推荐了,返回首页