【NLP】语义分析

语义计算的任务:解释自然语言句子或篇章各部分(词、词组、句子、段落、篇章)的含义。

面临的困难

  1. 自然语言句子中存在大量的歧义,涉及指代、同义、多义、量词的辖域、隐喻等
  2. 同一句子对于不同的人来说可能有不同的理解
  3. 语义计算的理论、方法、模型尚不成熟

格语法

语义网络

事件的语义关系

优点

  • (1)直接而明确地表达概念的语义关系,模拟人的语义记忆和联想方式;
  • (2)可利用语义网络的结构关系检索和推理,效率高。

缺点:它不适用于定量、动态的知识;不便于表达过程性、控制性的知识

概念依存理论

CD理论的三个层次:

  • 基本动作

  • 剧本

  • 计划

词义消歧

1.早期基于规则的消歧方法

2.统计机器学习消歧方法(基本思路:一个词的不同语义一般发生在不同的上下文中。)

  • 有监督学习方法
  • 无监督学习方法

3.基于词典信息的消歧方法

语义角色标注

基本方法:

  • 基于短语结构句法分析的SRL方法
  • 基于依存关系的SRL方法
  • 基于语块分析的SRL方法

主要问题:

  • 对句法分析器性能的严重依赖性
  • 领域适应能力差

词向量表示

基于文本的词汇语义表示模型

  • 共现矩阵方法

神经网络方法——基于文本学习词汇语义表示

  • 用周围词预测中间词的方法―连续词包模型(CBOW)
  • 连续skip-gram模型:通过中间词预测周围词的概率

基于图像学习词汇语义表示

  • 特征描述子,如SIFT算法,直接提取图像的关键点等特征

基于语音学习词汇语义表示

  • 利用声学特征

基于多模态信息学习词汇语义表示

基于人脑的成分语义表征

文本情感分析

也称为观点挖掘(OpinionMining),是针对人们对实体(包括产品、服务、组织、个人、议题、事件、话题及他们的属性等)表达的观点、评价、态度和情感进行计算的研究。

按分析粒度分为:

  1. 篇章级情感分析
  2. 句子级情感分析
  3. 方面级情感分析

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

沉淀体育生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值