利用tensorflow estimator API实现双塔推荐算法

最新推荐文章于 2024-05-02 18:03:27 发布

零落_World

最新推荐文章于 2024-05-02 18:03:27 发布

阅读量2.3k

点赞数 1

分类专栏： tensorflow 深度学习文章标签： tensorflow 深度学习

本文链接：https://blog.csdn.net/cdj0311/article/details/105953084

版权

本文展示了如何利用tensorflow estimator API实现双塔推荐算法的分布式训练。提供了包括特征处理、模型定义、数据输入和主函数在内的完整代码模板，适用于自定义数据和模型结构。在config.py中配置参数，通过调整run_on_cluster参数可选择单机或分布式运行。

摘要由CSDN通过智能技术生成

本文完整代码见： https://github.com/cdj0311/two_tower_recommendation_system

Tensorflow estimator实现分布式训练很简单，只需要将数据进行相应的切分丢给模型就可以很方便的完成分布式训练了。以下代码是一个完整的推荐算法模板，可根据自己的需要修改数据读取和模型结构部分，tensorflow==1.13.1。

1. 特征处理部分，feature_processing.py

#coding:utf-8
import tensorflow as tf
from tensorflow import feature_column as fc
import config

FLAGS = config.FLAGS

class FeatureConfig(object):
    def __init__(self):
        self.user_columns = dict()
        self.item_columns = dict()
        self.feature_spec = dict()

    def create_features_columns(self):
        # 向量类特征
        user_vector = fc.numeric_column(key="user_vector", shape=(128,), default_value=[0.0] * 128, dtype=tf.float32)
        item_vector = fc.numeric_column(key="item_vector", shape=(128,), default_value=[0.0] * 128, dtype=tf.float32)
        
        # 分桶类特征
        age = fc.numeric_column(key="age", shape=(1,), default_value=[0], dtype=tf.int64)
        age = fc.bucketized_column(input_fc, boundaries=[0,10,20,30,40,50,60,70,80])
        age = fc.embedding_column(age, dimension=32, combiner='mean')
        
        # 分类特征
        city = fc.categorical_column_with_identity(key="city", num_buckets=1000, default_value=0)
        city = fc.embedding_column(city, dimension=32, combiner='mean')
        
        # hash特征
        device_id = fc.categorical_column_with_hash_bucket(key="device_id", 
                    hash_bucket_size=1000000, dtype=tf.int64)
        device_id = fc.embedding_column(device_id, dimension=32, combiner='mean')

        item_id = fc.categorical_column_with_hash_bucket(key="item_id", 
                    hash_bucket_size=1000000, dtype=tf.int64)
        item_id = fc.embedding_column(item_id, dimension=32, combiner='mean')
        
        self.user_columns["user_vector"] = user_vector
        self.user_columns["age"] = age
        self.user_columns["city"] = city
        self.user_columns["device_id"] = device_id
        self.item_columns["item_vector"] = item_vector
        self.ite

最低0.47元/天解锁文章

零落_World

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
2
评论
利用tensorflow estimator API实现双塔推荐算法

Tensorflow estimator实现分布式训练很简单，只需要将数据进行相应的切分丢给模型就可以很方便的完成分布式训练了。以下代码是一个完整的推荐算法模板，可根据自己的需要修改数据读取和模型结构部分，tensorflow==1.13.1。1. 特征处理部分，feature_processing.py#coding:utf-8import tensorflow as tffrom...
复制链接

扫一扫