自编码模型与自回归模型记录

自回归模型

        处理自然语言时,通常会从左到右的计算前后词汇间的概率,如n-gram,此时只考虑了前文词汇的影响,如果从右到左的增加后文词汇的影响时,则称为自回归模型,如使用单向 transformer 的GPT模型,或拼接的双向LSTM模型等。

自编码模型

        训练时随机 MASK掉文本中的词汇,根据上下文预测该 MASK词汇的模型,如 Bert。

对比

自回归模型不能自然的同时获取单词的上下文信息(拼接两个方向的LSTM效果不佳);自编码语言模型能把上下文信息融合到模型中,Bert中的Transformer含有整句文本信息,等价于双向语言模型,但在Fine-tune时模型看不到MASK标记,会带来误差,可尝试XLNet模型解决上述问题。

参考:

自回归(Autoregressive)和自编码(Autoencoder)语言模型_郝同学的博客-CSDN博客

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
A:自编码器是一种无监督学习算法,可以学习数据的隐藏特征并重构输入,因此在资产定价模型中可以被用来提取资产特征和建立可解释性强的模型。 以下是一个利用自编码器完成资产定价模型的步骤: 1. 数据预处理:首先需要将原始数据进行清洗、处理缺失值,标准化等预处理操作,以保证数据的质量和一致性。同时,还需要将数据划分为训练集和测试集。 2. 自编码器建模:我们需要使用自编码器对资产数据进行特征提取,同时还可以根据需要对特定资产进行离群值检测。自编码器可以采用不同的结构和参数来提取特征,例如可以使用深度自编码器。自编码器训练完成后,可视化和可解释性分析可以帮助我们更加理解资产特征的关系。 3. 特征提取和降维:使用训练好的自编码器对所有资产数据进行特征提取和转换,得到降维后的数据。这个数据集包含了所有资产的重要特征。 4. 模型建立:使用降维后的资产数据集作为模型的输入,建立资产定价模型,例如线性回归模型、支持向量机模型或者神经网络模型等等。特别对于机器学习模型,考虑使用特征选择技术精简部分数据特征。 5. 模型评估: 通过评估模型预测结果与实际结果的误差,评定模型的准确度和健壮性。 通过以上步骤,我们可以建立一个自编码器辅助的资产定价模型。这个模型不仅可以提高预测准确度,同时还提供了更加直观的特征解释。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值