DeepTables 相关链接
- API: https://deeptables.readthedocs.io/en/latest/
- Repo:
- https://github.com/DataCanvasIO/DeepTables
- https://github.com/DataCanvasIO/Hypernets
最近看到开源的 DeepTables, 试用了一下, DeepTables repo 的 example 做得比较好,他们的架构图
DeepTables 可以处理结构化数据这一部分,因为模型相对成熟,结构化数据相对比较好处理。网络方面,支持
-
components:
‘dnn_nets’
‘linear’
‘cin_nets’
‘fm_nets’
‘afm_nets’
‘opnn_nets’
‘ipnn_nets’
‘pnn_nets’,
‘cross_nets’
‘cross_dnn_nets’
‘dcn_nets’,
‘autoint_nets’
‘fg_nets’
‘fgcnn_cin_nets’
‘fgcnn_fm_nets’
‘fgcnn_ipnn_nets’
‘fgcnn_dnn_nets’
‘fibi_nets’
‘fibi_dnn_nets’ -
preset models: (in package deeptables.models.deepnets)
DeepFM
xDeepFM
DCN
PNN
WideDeep
AutoInt
AFM
FGCNN
FibiNet
适用场景
- 集成了常见的 model 与 layer 的抽象,对结构化数据支持比较好,可以用于快速验证
- 集成了 AutoML 的超参搜索功能,对于小数据集比较友好,根据描述可以在某个 kaggle 竞赛中达到冠军级水平
不适用的场景
- 对分布式训练有比较高要求,默认的使用 keras 实现,里面分布式训练用的是原生的 distribute_strategy