推荐
文章平均质量分 56
loong_XL
这个作者很懒,什么都没留下…
展开
-
推荐中商品的热度时间衰减降权:牛顿冷却定律;贝叶斯平均
牛顿冷却定律当前温度 = 上期温度 x exp(-(冷却系数) x 间隔时间)当前热度分=上一期得分 x exp(-(冷却系数) x 间隔的小时数)冷却系数越大下降越快;df = df.withColumn("datediff", F.datediff(F.col("date"), F.col('action_date')))df = df.withColumn("exp", F.exp(-F.col('datediff') * cooling_coef))df = df.withColum原创 2022-03-25 09:24:28 · 1688 阅读 · 0 评论 -
din、bst 深度兴趣网络排序ctr 数据训练;deepctr加载embedding向量;id类型值hash
数据下载:链接:https://pan.baidu.com/s/1m7mViwM-KPJxmTLdpotRRg 提取码:obmu 数据说明:user端特征有5个,分别为["user_id", "gender", "age", "hist_movie_id", "hist_len"];user_id 为 用户ID特征,离散特征,从1-3表示;gender 为 用户性别特征,离散特征,从1-2表示; age 为 用户年龄特征,离散特征,从1-3表示; hist_movie_id 为 用户观看的mo原创 2021-03-26 16:58:40 · 1451 阅读 · 3 评论 -
keras 多任务loss多输出模型搭建和callback使用
#esimimport tensorflow as tffrom tensorflow.keras import *from tensorflow.keras.layers import *from sklearn.model_selection import train_test_split# from xgboost import XGBClassifierfrom sklearn.metrics import accuracy_scorefrom sklearn.preprocessin原创 2020-06-19 11:04:16 · 951 阅读 · 0 评论 -
esim、transformer加lstm和textcnn多分类模型(tf2)
注意tf2 embedding的使用:加载预训练词向量1、创建矩阵,索引与词向量的对应映射model_creative_id = gensim.models.Word2Vec.load('model_creative_id_word_skip_200_3')## 构造包含所有词语的 list,以及初始化 “词语-序号”字典 和 “词向量”矩阵vocab_list = [word for word, Vocab in model_creative_id.wv.vocab.items()]# 存储原创 2020-06-15 10:53:15 · 1135 阅读 · 0 评论 -
word2vec 电影推荐系统,加载腾讯词向量
word2vec词向量最后转成统一长度的电影item唯一表示1、 分词、训练# coding:utf-8import gensimfrom gensim.models import word2vecfrom gensim.models.doc2vec import Doc2Vec TaggededDocument = gensim.models.doc2vec.TaggedDocumentpath = r'/Users/lonng/Desktop/v+/呆萌的停用词表.txt'impor原创 2020-06-08 17:50:28 · 1124 阅读 · 0 评论 -
keras多输入lstm形式和tf2 lstm加attention
1、keras多输入二分类与多分类二分类X11=X1.reshape(X1.shape[0],n_timesteps,X1.shape[1])X22=X2.reshape(X2.shape[0],n_timesteps,X2.shape[1])X33=X3.reshape(X3.shape[0],n_timesteps,X3.shape[1])# y1=OneHotEncoder(sparse = False).fit_transform(y)# y2 = y1.reshape(y1.shape原创 2020-06-07 23:42:28 · 1586 阅读 · 2 评论 -
movielens数据集搭建电影推荐系统(CB、CF、HOT)
代码参考我已上传github:https://github.com/lonngxiang/movielens_recommendation主要是通过基于电影内容(CB)的相似、用户电影协同过滤(CF)、电影热评分榜(HOT)三块做主要的召回,排序主要是三块召回内容再进行手工权重的分配排序本次用的数据集是movielns 10M的,下载放在data目录下面就行,这是提供的百度网盘下载:https://pan.baidu.com/s/1w7lXqzWLODY075MoJ6l_6A 密码:t7n3主要用原创 2020-05-12 15:05:28 · 2133 阅读 · 0 评论 -
基于内容的电影推荐系统-tdidf doc2vec文本相似推荐及热评分榜、cf模型推荐
首先使用的数据是movielens(用的是10m大小的这份,用户100万数据打分):http://files.grouplens.org/datasets/movielens/ml-10m-README.html1、关于电影hot排行榜统计import pandas as pdcolumn_names = ['user_id', 'item_id', 'rating', 'timesta...原创 2020-05-06 15:59:11 · 1105 阅读 · 0 评论 -
pyspark 协同过滤矩阵分解ALS 电影数据
数据下载:https://github.com/apache/spark/tree/master/data/mllib/als代码案例参考:https://github.com/apache/spark/blob/master/examples/src/main/python/ml/als_example.py需要注意代码里long(p[3])改成floatratingsRDD = pa...原创 2020-04-17 18:36:55 · 1633 阅读 · 0 评论