建立原因
开源项目Recommended System with TF2.0主要是对阅读过的部分推荐系统、CTR预估论文进行复现。建立的原因有三个:
- 理论和实践似乎有很大的间隔,学术界与工业界的差距更是如此;
- 更好的理解论文的核心内容,增强自己的工程能力;
- 很多论文给出的开源代码都是TF1.x,因此想要用更简单的TF2.0进行复现; 当然也看过一些知名的开源项目,如DeepCTR等,不过对自己目前的水平来说,只适合拿来参考。
项目特点
项目特点:
- 使用TF2.0-CPU进行复现;
- 每个模型都是相互独立的,不存在依赖关系;
- 模型基本按照论文进行构建,实验尽量使用论文给出的的公共数据集。如果论文给出github代码,会进行参考;
- 对于实验数据集有专门详细的介绍;
- 代码源文件参数、函数命名规范,并且带有标准的注释;
- 每个模型会有专门的代码文档(.md文件)或者其他方式进行解释;
目前复现模型
目前复现的模型有(按复现时间进行排序):
- NCF
- DIN
- Wide&Deep
- DCN
- PNN
- Deep Crossing
- DeepFM 持续更新中······
具体内容
开源项目的具体内容如下:
1、数据集的介绍
对复现过程中所使用的数据集进行简单的介绍、对其中的特征进行分析以及处理数据集的过程。
例如&#