大数据营销
文章平均质量分 90
mishidemudong
菜鸟上路,一颗红心,两手准备。
展开
-
推荐系统炼丹笔记:多模态推荐之用户评论篇
作者:一元 公众号:炼丹笔记目前非常多的推荐系统主要使用用户的一些基础反馈信息来作为最终的标签进行模型的训练,例如点击/购买等,但是却鲜有文章去进一步挖掘用户的其它反馈,例如用户对于该产品的评论,很多的评论相较于点击等反馈更加具有表示性,比如你经常向一个用户推荐一类商品,该商品虽然点击率很高,但是该用户之前已经评论了恶心之类的,这么继续推下去的化很可能使得该用户不再使用该软件。所以推荐系统里面的用户评论是否有用呢,按理说是有用的,比如有些不良的商品点击率极高,但是评论却极差,通过挖掘评论的信息.转载 2021-08-11 11:42:26 · 451 阅读 · 0 评论 -
#####haohaohao#####BERT实战多标签标注模型(附github源码)
摘要:之前广告行业中那些趣事系列2:BERT实战NLP文本分类任务(附github源码),我们通过BERT构建了二分类器。这里根据实际项目需要使用BERT构建多标签标注模型,可通过一个模型识别多类标签,极大提升建模效率。实际项目中会根据业务需要同时使用二分类器和多标签标注模型完成文本识别任务。通过本篇学习,小伙伴们可以使用BERT模型来解决多标签标注任务。对数据挖掘、数据分析和自然语言处理感兴趣的小伙伴可以多多关注。目录01 多标签标注任务背景介绍02 多...转载 2020-08-04 09:46:55 · 993 阅读 · 1 评论 -
推荐系统系列二:推荐系统的工程实现
下面内容转自大数据与人工智能微信公众号,由于网络上推荐系统的相关学习资料太多太杂,东拼西凑学习很难摸出门道,同时我也在学习推荐系统,因此我将该系列内容摘录到我的博客,方便大家直接在博客中查看,大家一起学习进步,后面我也会阅读推荐系统相关的论文,并在本博客记录笔记,希望大家一起进步哈。在我更新第一篇《推荐系统介绍》之后,过了一两天这篇介绍的阅读量就达到了三百多,可见当下存在一个矛...转载 2020-02-08 18:43:22 · 1282 阅读 · 0 评论 -
推荐系统系列一:推荐系统介绍
下面内容转自大数据与人工智能微信公众号,由于网络上推荐系统的相关学习资料太多太杂,东拼西凑学习很难摸出门道,同时我也在学习推荐系统,因此我将该系列内容摘录到我的博客,方便大家直接在博客中查看,大家一起学习进步,后面我也会阅读推荐系统相关的论文,并在本博客记录笔记,希望大家一起进步哈。===================正文开始===================一,推荐系统产生的背景...转载 2020-02-08 16:34:38 · 2150 阅读 · 0 评论 -
@#####haohaohao#####推荐系统技术演进趋势:从召回到排序再到重排
“张俊林老师最新推荐技术总结,近乎覆盖推荐分发全链路。召回侧介绍了传统多路x2i到模型召回的发展历程以及知识图谱和GNN在其中的应用;排序侧从模型的表达能力、优化目标和特征及信息的利用三个方面展示了各种先进技术如何大放异彩;最后梳理了重排技术的演进趋势。”作者:张俊林来源:知乎专栏 深度学习前沿笔记,转载请联系作者授权。编辑:happyGirl推荐系统技术,总体而言,与NL...转载 2020-02-04 11:41:34 · 492 阅读 · 0 评论 -
LibRec 每周算法:DeepFM
本周介绍一篇来自与哈工大与华为诺亚方舟实验室的论文。 本文提出的DeepFM模型有效的结合了神经网络与因子分解机在特征学习中的优点。DeepFM可以同时提取到低阶组合特征与高阶组合特征,并除了得到原始特征之外无需其他特征工程。实验表明DeepFM比其他用于CTR的模型更加有效和高效。Guo et al., DeepFM: A Factorization-Machine based Neur转载 2017-12-13 11:13:30 · 4426 阅读 · 0 评论 -
互联网广告综述之点击率特征工程
互联网广告综述之点击率特征工程一.互联网广告特征工程博文《互联网广告综述之点击率系统》论述了互联网广告的点击率系统,可以看到,其中的logistic regression模型是比较简单而且实用的,其训练方法虽然有多种,但目标是一致的,训练结果对效果的影响是比较大,但是训练方法本身,对效果的影响却不是决定性的,因为训练的是每个特征的权重,权重细微的差别不会引起ctr的巨大转载 2017-12-14 10:05:19 · 296 阅读 · 0 评论 -
为什么要做用户行为分析?
一、什么是用户行为?用户行为由最简单的五个元素构成:时间、地点、人物、交互、交互的内容。(一)什么是用户行为?对用户行为进行分析,要将其定义为各种事件。比如用户搜索是一个事件,在什么时间、什么平台上、哪一个ID、做了搜索、搜索的内容是什么。这是一个完整的事件,也是对用户行为的一个定义;我们可以在网站或者是 APP 中定义千千万万个这样的事件。有了这样的事件以后,就可以把用户行为连起来观察。用户首次...转载 2018-03-19 16:33:09 · 5204 阅读 · 0 评论 -
运营实战:5个步骤分析目标人群画像流程图
定位目标人群的“样子”就是从你的目标客户群身上找共同的一些特征,如年龄,爱好,受教育程度,生活环境,经济收入等!通过这些特征我们可以快速在大千的网络世界中去找到他们,然后有针对性的去解决他们的痛点;话不多说,接下来我们上干货,先分享一个我自己总结的关于准确定位目标客户画像的流程图给大家:下面来解释一下上面的流程图:1. 提取产品优势和卖点首先我们要列出产品本身的主要优势和卖点。这里我们以减肥产品为...转载 2018-04-23 10:23:34 · 13806 阅读 · 1 评论 -
深度学习在美团搜索广告排序的应用实践
一、前言在计算广告场景中,需要平衡和优化三个参与方——用户、广告主、平台的关键指标,而预估点击率CTR(Click-through Rate)和转化率CVR(Conversion Rate)是其中非常重要的一环,准确地预估CTR和CVR对于提高流量变现效率,提升广告主ROI(Return on Investment),保证用户体验等都有重要的指导作用。传统的CTR/CVR预估,典型的机器学习方法包...转载 2018-07-03 14:53:08 · 431 阅读 · 0 评论 -
大数据用户画像方法与实践
在大数据时代,机器要学会从比特流中解读用户,构建用户画像就变得尤其重要。本文介绍了用户画像的理论和实践,以及在实际中的应用。如何根据用户画像进行精准营销?将用户画像应用于个性化推荐?一起来寻找答案吧~首先看一下大数据与应用画像的关系,现在大数据是炙手可热,相信大家对大数据的四个V都非常了解,大数据应该说是 信息技术的自然延伸,意味着无所不在的数据。我们先看下数据地位发生转变的历史,在传...转载 2018-07-18 14:53:38 · 1929 阅读 · 0 评论 -
详细阐述:由点及面的CRM认知
未来商业都是要围绕着人展开的,广义的讲所有业务的产品都可以纳入CRM,CRM将是各大平台或商家适应未来商业环境的基础标配。那么我们该怎样完整认知CRM呢?随着国内互联网的发展,中产阶级崛起和消费升级,未来的服务是贴近生活,贴近人的,未来的商业是需要基于人更加精细化区隔耕作的。如何区分和发掘不同用户身上的价值?如何维系稳定且活跃的用户关系?如何在竞争中稳定发展并持续提升品牌壁垒……这...转载 2018-09-06 11:56:09 · 312 阅读 · 0 评论 -
######好好好好好######常见计算广告点击率预估算法总结
前言谈到CTR,都多多少少有些了解,尤其在互联网广告这块,简而言之,就是给某个网络服务使用者推送一个广告,该广告被点击的概率,这个问题难度简单到街边算命随口告诉你今天适不适合娶亲、适不适合搬迁一样,也可以复杂到拿到各种诸如龟壳、铜钱等等家伙事,在沐浴更衣、净手煴香后,最后一通预测,发现完全扯淡,被人暴打一顿,更有甚者,在以前关系国家危亡、异或争国本这种情况时,也通常会算上一卦,国家的兴衰、转载 2017-12-13 11:05:44 · 413 阅读 · 0 评论 -
用户在线广告点击行为预测的深度学习模型
本次分享主要讲的是深度学习在Multi-field Categorical 这类数据集上的应用,这种类型的数据主要呈现以下特征:有多个域,每个域上的数据以ID格式呈现。本课题就是在信息检索这一大类下的应用,它的应用主要体现在:网络搜索、推荐系统、广告展示这些领域。深度学习对连续数据和序列数据(比如:图片像素、语音、自然语言等)有比较好的效果且目前已经有了比较成熟的应用,如:图像识别、语音识别等。转载 2017-12-13 11:02:37 · 1005 阅读 · 0 评论 -
如何在Python中实现RFM分析
RFM分析RFM分析是根据客户活跃程度和交易金额贡献,进行客户价值细分的一种方法;可以通过R,F,M三个维度,将客户划分为8种类型。RFM分析过程1.计算RFM各项分值R_S,距离当前日期越近,得分越高,最高5分,最低1分F_S,交易频率越高,得分越高,最高5分,最低1分M_S,交易金额越高,得转载 2017-11-20 20:43:53 · 3268 阅读 · 3 评论 -
Mahout推荐算法API详解
Mahout推荐算法API详解Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Cr转载 2017-12-08 18:02:55 · 351 阅读 · 0 评论 -
基于spark机器学习--物品推荐 物品推荐
基于spark机器学习---------物品推荐物品推荐[html] view plain copyimport org.apache.spark.SparkContext import org.apache.spark.mllib.recommendation.{ALS, Rating} import org.jblas.D转载 2017-12-11 10:06:47 · 898 阅读 · 0 评论 -
SparkMLlib---基于余弦相似度的用户相似计算
package mllibimport org.apache.log4j.{Level, Logger}import org.apache.spark.{SparkContext, SparkConf}import scala.collection.mutable.Map/** * Created by 汪本成 on 2016/8/4. */object UserSimilar转载 2017-12-11 11:12:17 · 1850 阅读 · 0 评论 -
#####带时间衰减因子#####应用实战: 如何利用Spark集群计算物品相似度
本文是Spark调研笔记的最后一篇,以代码实例说明如何借助Spark平台高效地实现推荐系统CF算法中的物品相似度计算。在推荐系统中,最经典的推荐算法无疑是协同过滤(Collaborative Filtering, CF),而item-cf又是CF算法中一个实现简单且效果不错的算法。在item-cf算法中,最关键的步骤是计算物品之间的相似度。本文以代码实例来说明如何利用Spark平台转载 2017-12-11 11:15:27 · 2501 阅读 · 0 评论 -
一个Spark推荐系统引擎的实现
一个Spark推荐系统引擎的实现阅读目录前言第一步:提取有效特征第二步:训练推荐模型第三步:使用ALS推荐模型第四步:物品推荐第五步:推荐效果评估小结回到顶部前言 经过2节对MovieLens数据集的学习,想必读者对MovieLens数据集认识的不错了;同时也顺带回顾了些Spark编程技巧,Python数据分析技巧。转载 2017-12-04 13:33:51 · 456 阅读 · 0 评论 -
推荐系统中基于深度学习的混合协同过滤模型
近些年,深度学习在语音识别、图像处理、自然语言处理等领域都取得了很大的突破与成就。相对来说,深度学习在推荐系统领域的研究与应用还处于早期阶段。 携程在深度学习与推荐系统结合的领域也进行了相关的研究与应用,并在国际人工智能顶级会议AAAI 2017上发表了相应的研究成果《A Hybrid Collaborative Filtering Model with Deep Structure fo转载 2017-12-04 15:06:14 · 785 阅读 · 0 评论 -
关于点击率模型,你知道这三点就够了
说到计算广告,或者个性化推荐,甚至一般的互联网产品,无论是运营、产品还是技术,最为关注的指标,就是点击率。业界也经常流传着一些故事,某某科学家通过建立更好的点击率预测模型,为公司带来了上亿的增量收入。点击率这样一个简单直接的统计量,为什么要用复杂的数学模型来刻画呢?这样的模型又是如何建立与评估的呢?我们这一期就来谈谈这个问题。一、为什么要建立一个点击率模型?无论是人工运营还是机器决策,我们转载 2017-12-13 10:25:38 · 1453 阅读 · 0 评论 -
DeepFM:深度学习算法助力华为应用市场APP推荐
今年8月下旬,在澳大利亚墨尔本召开的IJCAI2017会议上,来自华为伏羲推荐团队的专家发表了他们在深度学习推荐算法方面的最新成果。伏羲推荐引擎是华为应用市场联合华为诺亚方舟实验室开发的一款推荐系统。针对华为应用市场的业务特点和数据特征,伏羲推荐算法团队提出的端到端的深度学习推荐模型DeepFM,助力华为应用市场更加精准、个性化的推荐体验。华为诺亚方舟实验室算法专家在IJCAI2017转载 2017-12-13 10:32:35 · 3955 阅读 · 0 评论 -
基于LR的新闻多分类(基于spark2.1.0, 附完整代码)
原创文章!转载请保留原始文章链接,谢谢!环境:Scala2.11.8 + Java1.8.0_112Spark2.1.0 + HanLP1.3.2 完整项目代码见我的GitHub:https://github.com/yhao2014/ckoocML(因为HanLP分词模型太大,未上传至项目中,需要的请从HanLP发布页下载,然后解压后将转载 2017-12-13 10:38:14 · 1128 阅读 · 0 评论 -
大数据实时推荐-不只是统计
随着大数据时代的来临,如何帮助用户从大量信息中迅速获得对自己有用的信息成为众多商家的重要任务,个性化推荐系统应运而生。个性化推荐系统以海量数据挖掘为基础,引导用户发现自己的信息需求,现已广泛应用于很多领域。传统的个性化推荐系统,采用定期对数据进行分析的做法来更新模型。由于是定期更新,推荐模型无法保持实时性,对用户当前的行为推荐结果可能不会非常精准。实时个性化推荐实时分析用户产生的数据,可以更准确地转载 2017-12-04 19:43:28 · 6609 阅读 · 0 评论 -
大数据在营销和销售中的十大应用
本文旨在给为大数据革命性改变市场营销和销售的众多趋势做一个概述, 其中综合了十个有关报告,介绍了十个大数据在如今的市场营销和销售策略中的应用。其中增长很快的一个领域就是定价:管理价格以及通过销售网络传播和优化定价。在有大数据算法和先进的分析技术的今天,为给定的产品或服务实现价格优化越来越不在话下。就连在不是那么有弹性的大宗商品驱动行业中,简化日常定价决策也已经是非常常见的了。 ◆ ◆ ◆转载 2017-10-17 15:12:31 · 3175 阅读 · 0 评论