【DeepCTR库】学习入门笔记02

最新推荐文章于 2024-04-20 09:48:30 发布

KryHan

最新推荐文章于 2024-04-20 09:48:30 发布

阅读量830

点赞数 1

分类专栏：【推荐系统】其他文章标签：学习深度学习人工智能

本文链接：https://blog.csdn.net/qiyihan/article/details/124748496

版权

【推荐系统】同时被 2 个专栏收录

15 篇文章 4 订阅

订阅专栏

其他

10 篇文章 0 订阅

订阅专栏

feature column

feature column.py
类别特征处理：SparsFeat
数值特征处理：DenseFeat
序列特征处理：VarLenSparseFeat

方法：
get_feature_name:获取所有特征name
build_input_feature:将所有特征转为keras tensor
get_liner_logit：获取线性变换结果
input_from_feature_column:为所有特征创建嵌入矩阵，并分别返回各自的矩阵字典

类别特征（SparsFeat）
将类别特征转化为固定维度的稠密特侦
性别、国际

name：生成的特征列姓名
vocabulary_size：不同特征值的个数或哈希值
embedding_dim：嵌入向量的维度
use_hash：是否使用哈希编码，默认False
dtype：默认int32
embeddings_initializer：嵌入矩阵初始化方式，默认随机初始化
embedding_name：默认None，其名字与name保持一致
group_name：特征列所属的组
traninable：嵌入矩阵是否可训练，默认True

数值特征（DenseFeat）
将稠密特征转为向量形式，

name: 特征列名字
dimension: 嵌入特征维度，默认是1
dtype: 特征类型，default="float32"，
transform_fn: 转换函数，可以是归一化函数，也可以是其它的线性变换函数，以张量作为输入，经函数处理后，返回张量  比如： lambda x: (x - 3.0) / 4.2)

序列特征处理（VarLenSparseFeat）
处理文本序列长度的可变长度类型特征

sparsefeat：属于SparseFeat的实例
maxlen：所有样本中该特征列的长度最大值
ombiner：池化方法（mean,sum,max），默认是mean
length_name：特征长度名字，如果是None的话，表示特征中的0是用来填充的
weight_name：默认None，如果不为空，那么序列特征会与weight_name的权重特征进行相乘
weight_norm：是否对权重分数做归一化，默认True