下表是对应的特征处理表逻辑:keras layer中对应的处理类更加直接易于理解。
例如连续性数字的离散化处理layers.Discretization
字符型或无大小关系的hash桶化:layers.Hashing
字符串的数字化编码处理:layers.StringLookup
数字类型(无大小区分)数据的数字化编码:layers.IntegerLookup
上面三个可以将输入统一化为one_hot、multi_hot或integer
对于integer形式,可以再通过使用layers.CategoryEncoding实现指定维度的映射变换(可训练)
参考:Migrating feature_columns to TF2's Keras Preprocessing Layers | TensorFlow Core