【Embedding合集】推荐系统/风控领域中动态连续型不定长序列数据处理方案
在推荐系统或是风控领域都存在这样一类动态连续型序列数据,如用户最近一个月消费记录,最近半年还款记录等等,这些序列数据的每一个元素都是连续型的数字,并且长度不定(每个用户消费的笔数都不一样),但这类动态连续型不定长序列数据又往往能够捕捉用户随时间变化的偏好,本文将针对这类数据提出三种工业界较为常用的解决方案。
一、不定长序列修剪
将不定长序列数据通过填充(padding)或截断(slicing)等方法转换为等长序列后,再将其输入自编码器中以实现嵌入(Embedding)。随后,将嵌入后的数据输入至模型中进行建模。此外,嵌入后的数据也可以输入到其他模型,如长短期记忆网络(LSTM)、递归神经网络(RNN)或门控循环单元(GRU)等,以进行进一步建模,之后,将训练完成的模型输出的预测结果用作后续建模操作中的新特征。具体的实现方案可以参考链接中的“方案一”:【Embedding合集】深度模型实现对序列数据的Embedding(SentenceEmbedding) 。
二、不定长序列哈希
直接对完整的序列进行Hash操作,再将Hash后的结果作为一个新的特征代入后续模型完成建模工作。