NLP系列——NLP基础

本文介绍了NLP的基础知识,包括分词、词性标注、命名实体识别、句法分析、指代消解、情感识别、纠错和问答系统等术语;并提到了中文维基百科、搜狗新闻语料库和IMDB情感分析语料库;最后概述了NLP的知识结构,如词法分析、句法分析和语义分析的重要性。
摘要由CSDN通过智能技术生成

NLP系列——NLP基础

NLP基础部分包括基础术语、知识结构、语料库等部分内容。



一、基础术语

基础专业词汇包括:分词(segment)、词性标注(part-of-speach tagging)、命名实体识别(NER,Named Entity Recognition)、句法分析(syntax parsing)、指代消解(anaphora resolution)、情感识别(emotion recognition)、纠错(correction)、问答系统(QA system)等。

1.1 分词(segment)

英文:由空格分隔
中文:最常用的手段是基于字典的最长串匹配

1.2 词性标注(part-of-speach tagging)

对词的词性进行标注:动词、名词、形容词
目的:表征词的一种隐藏状态,隐藏状态构成的转移就构成了状态转移序列

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值