自然语言处理之:语义分析-1

语义分析(或者叫意义生成)是 NLP 中的任务之一。它被定义为确定字符或单词序列
意义的过程,其可用于执行语义消歧任务。
本章将包含以下主题:
• NER。
• 使用 HMM 的 NER 系统。
• 使用机器学习工具包训练 NER。
• 使用词性标注执行 NER。
• 使用 Wordnet 生成同义词集 id。
• 使用 Wordnet 进行词义消歧。

NLP 指的是在自然语言上执行计算。语义分析是处理自然语言时需要执行的步骤之一。
在分析一个给定的句子时,如果已经构建了句子的句法结构,那么这个句子的语义分析就算完成了。语义解释指的是将意义分配给句子,上下文解释指的是将逻辑形式分配给知识
表示。语义分析的原语或基本单位被称为意义或语义(meaning 或 sense)。ELIZA 是处理语义的工具之一,是由 Joseph Weizenbaum 在六十年代开发出来的,它使用替换和模式匹配技术来分析句子并且为给定的输入提供输出。MARGIE 是由 Robert Schank 在七十年代开
发出来的,它可以使用 11 种原语来表示所有的英语动词。MARGIE 可以解释一个句子的语义并借助原语来表示其语义。MARGIE 之后进一步让位于脚本的概念,脚本应用机制(Script Applier Mechanism,SAM)就是基于 MARGIE 开发出来的,它可以翻译来自不同语言的句子,例如英语、汉语、俄语、荷兰语和西班牙语等。为了处理文本数据,使用了
一个 Python 库也就是 TextBlob 库。TextBlob 提供了用于执行 NLP 任务的 API,例如词性标注、名词短语提取、文本分类、机器翻译、情感分析等。

语义分析可用于查询数据库和检索信息。另一个 Python 库 Gensim 可用于执行文档索引、主题建模和相似性检索。Polyglot 是一个支持多语言应用的 NLP 工具,它提供了 40种语言的命名实体识别、165 种语言的分词、196 种语言的语言检测、136 种语言的情感分析、16 种语言的词性标注、135 种语言的形态分析、137 种语言的嵌入以及 69 种语言的音译。MontyLingua 是一个用于执行有关英语文本语义解释的 NLP 工具,它可以从英文句子中提取诸如动词、名词、形容词、日期、短语等语义信息。
可以使用逻辑学来正式地表示句子。命题逻辑中的基本表达式或句子可以用诸如 P、Q、 R 等命题符号来表示。命题逻辑中的复杂表达式可以用布尔运算符来表示。例如,为了表示句子 If it is raining, I’ll wear a raincoat,可以使用命题逻辑:
P: It is raining.
• Q: I’ll wear raincoat.
• P→Q: If it is raining, I’ll wear a raincoat.
考虑下面 NLTK 中用于展示所使用的运算符的代码:

>>> import nltk 
>>> nltk.boolean_ops() 
negation - 
conjunction & 
disjunction | 
implication -> 
equivalence <->
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

椒椒。

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值