【Embedding合集】推荐系统/风控领域中动态连续型不定长序列数据处理方案

本文介绍了推荐系统和风控领域处理动态连续型不定长序列数据的三种方法:序列修剪、哈希和离散化。通过序列修剪,使用填充或截断将数据转化为等长序列并进行Embedding;序列哈希直接对完整序列进行Hash,形成新特征;序列离散化则将连续数据分桶,利用Word2Vec进行处理。
摘要由CSDN通过智能技术生成

【Embedding合集】推荐系统/风控领域中动态连续型不定长序列数据处理方案

在推荐系统或是风控领域都存在这样一类动态连续型序列数据,如用户最近一个月消费记录,最近半年还款记录等等,这些序列数据的每一个元素都是连续型的数字,并且长度不定(每个用户消费的笔数都不一样),但这类动态连续型不定长序列数据又往往能够捕捉用户随时间变化的偏好,本文将针对这类数据提出三种工业界较为常用的解决方案。



一、不定长序列修剪

将不定长序列数据通过填充(padding)或截断(slicing)等方法转换为等长序列后,再将其输入自编码器中以实现嵌入(Embedding)。随后,将嵌入后的数据输入至模型中进行建模。此外,嵌入后的数据也可以输入到其他模型,如长短期记忆网络(LSTM)、递归神经网络(RNN)或门控循环单元(GRU)等,以进行进一步建模,之后,将训练完成的模型输出的预测结果用作后续建模操作中的新特征。具体的实现方案可以参考链接中的“方案一”:【Embedding合集】深度模型实现对序列数据的Embedding(SentenceEmbedding)

二、不定长序列哈希

直接对完整的序列进行Hash操作,再将Hash后的结果作为一个新的特征代入后续模型完成建模工作。

  • 18
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值