阅读理解中对于doc和q的表示方法

本文介绍了机器阅读理解中doc和query的表示方法。对于doc,常见方法包括视作单词流序列并利用RNN建模,以及通过Attention计算得到整体的Doc Embedding。对于query,除了采用doc的表示方法外,还有结合双向RNN的尾部节点隐层状态来表征问题的整体语义。这些表示方法在不同场景下各有优势。
摘要由CSDN通过智能技术生成

一、对于doc的表示方法

  1. 方法一:
    最常见的一种方法是将一篇文章看成一个有序的单词流序列,如下模型所示,图中的每个圆圈代表某个单词的神经网络语义表达,图中的BiRNN代表双向RNN模型。
    在这个序列上使用RNN来对文章进行建模表达,每个单词对应RNN序列中的每个时间步的输入,RNN的隐层状态代表融合了本身单词以及其上下文语义的语言编码。
    这种表示方法的特点就是,它不对文章的整体语义进行编码,而是对每个单词及其上下文语义进行编码,在实际的使用过程中是使用每个单词的RNN隐层状态来进行相关计算。
    这里写图片描述
    方法一往往在机器阅读理解系统的原始输入部分对文章进行表示,因为对于很对阅读理解任务来说,本质上是从文章中推导出某个概率最大的单词作为问题的答案,所以文章以单词的形式来表征非常自然。
  2. 方法二:
    另一种常见的文章内容表达方式则是从每个单词的语义表达推导出文章整体的Doc Embedding表达,这种形式往往是在对问题和文章进行推理的内部过程中使用的表达方式。表达过程如下:

这里写图片描述
图中模型的具体表示含义是,类似于上一个图,先用双向RNN来对每个单词及其上下文进行语义表征,形成隐层状态表示,然后对于向量的每一维数值࿰

Stkcd [股票代码] ShortName [股票简称] Accper [统计截止日期] Typrep [报表类型编码] Indcd [行业代码] Indnme [行业名称] Source [公告来源] F060101B [净利润现金净含量] F060101C [净利润现金净含量TTM] F060201B [营业收入现金含量] F060201C [营业收入现金含量TTM] F060301B [营业收入现金净含量] F060301C [营业收入现金净含量TTM] F060401B [营业利润现金净含量] F060401C [营业利润现金净含量TTM] F060901B [筹资活动债权人现金净流量] F060901C [筹资活动债权人现金净流量TTM] F061001B [筹资活动股东现金净流量] F061001C [筹资活动股东现金净流量TTM] F061201B [折旧摊销] F061201C [折旧摊销TTM] F061301B [公司现金流1] F061302B [公司现金流2] F061301C [公司现金流TTM1] F061302C [公司现金流TTM2] F061401B [股权现金流1] F061402B [股权现金流2] F061401C [股权现金流TTM1] F061402C [股权现金流TTM2] F061501B [公司自由现金流(原有)] F061601B [股权自由现金流(原有)] F061701B [全部现金回收率] F061801B [营运指数] F061901B [资本支出与折旧摊销比] F062001B [现金适合比率] F062101B [现金再投资比率] F062201B [现金满足投资比率] F062301B [股权自由现金流] F062401B [企业自由现金流] Indcd1 [行业代码1] Indnme1 [行业名称1] 季度数据,所有沪深北上市公司的 分别包含excel、dta数据文件格式及其说明,便于不同软件工具对数据的分析应用 数据来源:基于上市公司年报及公告数据整理,或相关证券交易所、各部委、省、市数据 数据范围:基于沪深北证上市公司 A股(主板、小企业板、创业板、科创板等)数据整理计算
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值