Stochastic Answer Networks for Natural Language Inference阅读笔记

本文介绍了Stochastic Answer Network (SAN)模型,用于解决自然语言推理任务,通过多步推理来处理复杂任务。模型包括词汇编码、上下文编码、记忆层和答案模块,其中注意力机制和循环状态更新是关键。实验部分讨论了实现细节,如词嵌入、字符编码和BiLSTM的设置,并展示了模型的性能表现。
摘要由CSDN通过智能技术生成

概述

作者提出一种随即回答网络(stochastic answer network)来解决NLI问题.
和之前的模型根据输入直接预测结果不同, 该模型维护一个状态并迭代地改进其预测.
与单步推理相比, 这种多步推理方法可以对更复杂的推理任务进行建模.

模型

single-step inference architecture
单步推理网络结构就是利用输入的premise和hypothesis直接预测结果.

Multi-step inference with SAN
在这里插入图片描述
定义了一个新的循环状态 s t s_t st, 模型在生成最终输出之前, 每个时间步迭代生成 s t s_t st, 将 s T s_T sT作为最终的输出.

模型结构分为四部分:

  1. Lexicon encoding layer: compute word representation
  2. contextual encoding layer: modifie word representation in context
  3. memory generation layer: gather information from premise and hypothesis, form a “working memory” for the final answer module
  4. final answer module: type of multi-step network, predicts the relation between the premise and hypothesis.

Lexicon Encoding layer

首先, 将词向量和字向量做拼接, 这样可以比较好的解决OOV问题.
之后将拼接向量输入到两层Position-wise前馈网络得到最终的lexicon embedding E p ∈ R d × m , E h ∈ R d × n E^p\in \R^{d\times m}, E^h\in \R^{d\times n} EpRd×m,E

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
随机几何是无线网络中一种广泛使用的数学工具和分析方法。它涉及到将无线设备和网络中的资源(如基站、用户设备、信道等)建模为随机点或区域,并通过统计和概率方法来研究网络性能和效率。 随机几何可以用于评估无线网络的容量、覆盖范围、干扰水平等重要性能指标。通过将无线网络中的用户设备和基站建模为随机点,我们可以确定网络中特定区域的用户密度,并计算出网络的覆盖范围和用户容量。这对于网络规划和优化非常有帮助,可以确保网络能够满足用户的需求。 此外,随机几何也可以用于评估网络的干扰水平。通过建模其他基站和用户设备对信号的干扰,我们可以计算出网络中的干扰水平,并确定合适的信号传播方案和资源分配策略,以最小化干扰并提高网络的性能。 随机几何还可以用于研究无线传感器网络、蜂窝网络、物联网等各种无线网络的性能和效率。通过建立适当的随机模型,我们可以分析网络的拓扑结构、连通性、覆盖范围等特性,并提出相应的网络设计和优化策略。 总之,随机几何是一种强大的工具,可以帮助我们理解和优化无线网络的性能。它可以通过建立合适的数学模型和使用概率统计方法来评估网络的容量、覆盖范围、干扰水平等重要性能指标,并为网络规划、优化和设计提供指导。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值