最近在学习华为出品的CTR的项目,故借此记录一下过程。
1.Run the demo examples:
cd demo
python example1_build_dataset_to_h5.py
python example2_DeepFM_with_h5_input.py
第一步跑examples来快速开始并初步理解大概的一个工作流程,配置好环境并克隆源码后,在终端运行以上的命令即可简单的跑通examples。
2.Study the examples:
然后我开始看example1和example2的代码来进行一个初步的学习。
example1:
example1是用来构建数据的脚本,第一个问题是一句常见的python代码:
if __name__=='__main__':
网上查到的我能理解的讲解:
简单来讲就是作为脚本运行时会执行改语句下的代码,如果import到其他python脚本中则不会执行
example1的结构很简单,1是从指定的配置文件中加载参数,2是设置日志记录器并记录参数的值,3是设置特征编码器,4是构建数据集,即将处理后的特征数据划分为训练集、验证集和测试集
example2:
example2和example1的结构类似,不一样的是多了一块
Model initialization and fitting
也就是初始化模型并将其与准备好的数据进行拟合,即训练。
总结:demo是比较简单的示例,跑一跑可以熟悉这个项目的文件位置以及工作流程。