u010823625
让积累成为一种习惯。
展开
-
CTR预估模型演进史 · Deep&Cross、DIN、ESMM
CTR预估模型演进史 · Deep&Cross、DIN、ESMM1、Deep&Cross1.1 cross_layer2、DIN2.1 Dice激活函数2.2 Attention3、ESMM3.1 多任务学习3.2 多任务学习在推荐系统中的应用1、Deep&Cross1.1 cross_layerdef cross_op(x0, x, w, b): dot = tf.matmul(x0, tf.transpose(x)) cros= tf.tensordot(dot原创 2020-06-13 19:29:51 · 414 阅读 · 0 评论 -
面筋·七月ML300TI
NLP&ML&优化1、生成型&判别型2、最大概率分词 => 南京 市长 江大桥3、中文分词的基本方法3.1 基于语法规则的分词3.2 基于词典的分词3.2.1 最大匹配法3.2.2 最大概率法3.2.3 最短路径法3.3 基于统计的分词4、CRF、HMM、MEMM对比分析5、欧式距离&马式距离6、L1&L27、1、生成型&判别型判别模型(discriminative model)通过求解条件概率分布P(y|x)或者直接计算y的值来预测y生成模型(原创 2020-05-16 09:55:34 · 130 阅读 · 0 评论 -
Flink Learning Project :基于Flink的实时热门商品统计和订单支付模块
基于Flink的实时热门商品统计和订单支付模块1、实时热门商品统计(窗口聚合、窗口分组、TopN)2、订单超时失效(基于CEP)3、实时对账1、实时热门商品统计(窗口聚合、窗口分组、TopN)2、订单超时失效(基于CEP)3、实时对账...原创 2020-04-27 21:14:28 · 928 阅读 · 0 评论 -
面试项目2:基于Spark2.x的电商大数据统计分析平台
基于Spark2.x的电商大数据统计分析平台1、用户访问session分析(Spark Sql)1.1 复合查询2、刷单用户实时过滤(Spark Streaming)3、页面单跳转化统计(Spark Core)1、用户访问session分析(Spark Sql)1.1 复合查询2、刷单用户实时过滤(Spark Streaming)3、页面单跳转化统计(Spark Core)...原创 2020-04-27 21:05:34 · 1262 阅读 · 1 评论 -
面试项目1:基于电商评论数据集的多模态混合推荐系统
面试项目1:推荐系统1、数据收集:爬虫2、推荐之前:文章画像2.1 分词2.2 去停用词2.4 计算CountVectorizer2.5 计算IDF2.6 得到文章关键词TopN3、推荐之前:文章相似度3.1 mini data:TF-IDF、余弦相似度3.2 big data:Word2Vec、Saprk LSH4、推荐之前:用户画像4.1 确定用户偏好5、基于SVD的推荐:Spark ALS6...原创 2020-04-27 20:17:18 · 1026 阅读 · 1 评论 -
数仓、画像和推荐系统(4):精准营销、用户画像
数仓、画像和推荐系统(4)什么是用户画像什么是互联网广告广告精准推送系统需求开发效果知识点睛什么是用户画像用户画像:通过收集与分析用户的社会属性、生活习惯、消费行为等数据,通过标签化全面抽象出用户的信息全貌什么是互联网广告互联网广告就是通过网络广告平台在网络上投放广告。利用网站上的广告横幅、文本链接、多媒体的方法,在互联网刊登或发布广告,通过网络传递到互联网用户的一种高科技广告运作方...原创 2020-04-21 21:18:35 · 627 阅读 · 0 评论 -
数仓、画像和推荐系统(3):数仓的一个案例
数仓、画像和推荐系统(3)电商数仓项目ods层(原始数据层)用户行为业务数据dwd层(明细数据层)用户行为业务数据维度表事实表dws(数据服务层)ads(数据应用层)知识点睛电商数仓项目ods层(原始数据层)用户行为ods_start_logods_event_log业务数据ods_order_infoods_order_detailods_sku_infoods_us...原创 2020-04-21 20:26:30 · 432 阅读 · 0 评论 -
数仓、画像和推荐系统(2):大数据项目流程&技术栈
数仓、画像和推荐系统(2)流程流程参考文档业务数据数仓数据服务推荐系统数据同步离线分析实时分析机器学习/深度学习业务数据数仓数据服务推荐系统...原创 2020-04-20 14:19:41 · 354 阅读 · 0 评论 -
数仓、画像和推荐系统(1):数仓的基本概念
数仓、画像和推荐系统(1)什么是数仓?数据分层(ods->dwd->dws->ads)标配技能什么是数仓?概念:一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合目的:支持决策分析应用: 离线数据报表、数据挖掘、即席查询数据分层(ods->...原创 2020-04-20 10:32:23 · 417 阅读 · 0 评论