人工智能系列 推荐系统
广小辉
这个作者很懒,什么都没留下…
展开
-
python实现tensorflow2.0的常见优化器
tensorlow2.0中的常见优化器如下:其中,adam是最常使用的,比如esmm论文中使用。下面通过python实现几种常见的优化器。其中使用了tensorflow2.0 的tf.GradientTape来自动求微分。数据集构造build dataimport tensorflow as tfimport numpy as npimport seaborn as snsfrom matplotlib import pyplot as pltx = np.arange(-3, 7, 0原创 2020-10-15 10:40:34 · 1121 阅读 · 0 评论 -
推荐系统-基于tf.feature_column构建数据处理pipeline
import tensorflow as tfimport pandas as pdpets = {'pets': [[2, 4],[ 3, 8],[0 , -1],[1, 0]]} #猫0,狗1,兔子2,猪3df = pd.DataFrame(pets)column = tf.feature_column.categorical_column_with_identity(key='...原创 2020-04-29 17:57:11 · 258 阅读 · 0 评论 -
推荐系统-CTR平滑方式
背景在电商领域中,经常要计算或者CTR(点击通过率),CVR。以点击率CTR为例,CTR根据统计指标 CTR = 点击量/ 曝光量;具体需要看公司要求,有的是点击uv/ 曝光uv ,有的是点击pv/曝光pv ;然而实际应用中,会遇到两个问题:【新品问题】新商品点击率的预测和计算问题对于新上线的商品,其曝光为0,点击量也为0,此时这件商品的CTR应该为0 还是赋值一个初始值呢?【数据不可...原创 2020-04-05 16:15:16 · 2294 阅读 · 1 评论 -
推荐系统-深度学习在1688推荐系统中的落地实践
前言推荐导购场景在电商中是重要的满足用户“逛”和“买”的场景,本次主要聚焦在深度学习在阿里B2B电商推荐系统中的应用,其中包括商品推荐中的召回(多兴趣Deep Match)、排序(自研DMR)的相关工作,在新兴的互动内容场景(直播、短视频)中通过异构网络来解决异构信息的精准匹配问题。本文分享大纲如下:发展历史商品召回:Deep Match商品排序:DIN-DIEN, DMR内容排序...原创 2020-04-03 15:46:20 · 1342 阅读 · 0 评论 -
推荐系统-- GraphEmbedding
awesome-network-embeddingAlso called network representation learning, graph embedding, knowledge embedding, etc.The task is to learn the representations of the vertices from a given network.Graph...转载 2020-03-12 20:01:39 · 683 阅读 · 0 评论 -
机器学习 Doc2Vec原理及实战
1. 两种训练方法PV-DM(Distributed Memory Model of Paragraph Vectors)。训练方法如下图所示,构建一个Paragraph向量集合,另外在构建一个词向量集合,wv(word vector)在语料库中是共享的,而pv(paragraph vector)是唯一的,与每个paragraph一一对应。Pv和wv可以有不同的维度,用一个划窗在文本上滑动,用...原创 2020-02-29 20:45:10 · 808 阅读 · 0 评论 -
机器学习 特征工程【汇总1】
目录需要哪些数据数据如何存储数据如何清洗数据特征工程1. 需要哪些数据在进行机器学习之前,存在一个收集数据的过程,我们主要按照以下规则找出我们所需要的数据:业务的实现需要哪些规则?基于对业务规则的理解,尽可能找出对因变量有影响的所有自变量的数据数据埋点的流程:提需求—>前端植入埋点代码块—>灰度测试—>测试验收—>发版上线数据的可用性评估...原创 2020-01-17 22:48:10 · 357 阅读 · 0 评论 -
机器学习 Word2vec---2 python实现过程
获取语料库# define the corpus# 处理方法1import retext = 'natural language processing and machine learning \is fun and exciting'corpus = re.split('[\n]|\s+', text)# 处理方法2from gensim.utils import simple...原创 2020-01-06 20:52:04 · 558 阅读 · 0 评论 -
机器学习 Word2Vec ---1基本简介
Word Embeding [词嵌入] 简介VSM空间向量模型(VSMs)将词向量映射于一个连续的向量空间中,语义上近似的单词对应的词向量 映射到向量空间中也是相邻的数据点。向量空间模型在自然语言处理领域中有着丰富且漫长的历史,不过几乎所有利用这一模型的方法都依赖于分布式假设,其核心思想为:出现于上下文情境中的词汇都有类似的语义。采用这一假设的研究方法大致上分为以下几类:基于统计计数的方法...原创 2020-01-06 20:38:39 · 391 阅读 · 0 评论 -
推荐系统 Word2vector
在使用Uni-gram模型时(也就是词袋法)时,会导致数据非常稀疏。那么我们在训练模型时,就需要更多的数据。会导致存储和计算开销激增。One-hot-Representation 是最常用的词表示方法。它的优点是简单直观,容易理解。但是会出现词向量维数爆炸的问题,因为有多少个词,词向量就有多少维度,计算开销太大。OneHot还有一个问题,两个在词义上相似的词,在词向量上却没有相似性。...原创 2019-12-29 20:27:57 · 298 阅读 · 0 评论 -
《推荐系统实践》第1章 好的推荐系统
1.1 什么是推荐系统电商公司APP就是帮助用户找到自己所需要的信息/物品;如果用户知道自己需要什么,就通过搜索框【检索系统】或自己的经验浏览货架;如果提供的商品数量/信息量太大,就利用商品的类目或者属性信息来做初步过滤;如果用户自己也不知道需要什么样的,就要利用推荐系统来给用户推荐出商品。 推荐系统产生的条件:1、用户自己也不清楚自己的购买需求;2、商品数量过多,存在信息过载。...原创 2019-10-23 21:32:20 · 1662 阅读 · 0 评论