自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(7)
  • 收藏
  • 关注

转载 太多的.hive-stagingxxx文件的处理

跑一段时间的Hive程序之后,偶尔打开对应的HDFS文件夹,才发现在其目录下,产生了太多的.hive-staging_hive_date-time_ XXX文件。仔细一看,才发现几乎每个HIVE的查询语句都会产生这样的一个文件,这种文件会随着时间积累不断增加。这也是前段时间造成HDFS目录故障的原因之一。查了网上的相关说明,也没有比较好的说明,可能这是基

2016-11-22 23:34:35 1628

原创 【R与聚类算法】:确定K值个数

在无监督学习中,很多朋友都会面临同一个问题,我们应该将用户聚成几类?即如何确定K值问题。下面我们介绍两种常用的方法。轮廓系数法Nbcluster轮廓系数法    首先,我们载入数据,并对数据进行预先处理。请看

2016-11-16 19:32:25 3004

原创 【如何R实现聚类算法及3D可视化展示】:kmeans聚类方法在用户价值细分上的应用

Author : QQ Zhou 大家应该很熟悉RFM模型,这是在做用户价值细分常用的方法。主要涵盖的指标有R(Recency);消费频率(Frequency);消费金额(Monetary);RFM模型在用户价值细分上具有很强的解释性和可操作性。但以下为了展示R是如何聚类算法及可视化。我们姑且用R、F、M三个指标聚类得出具有实用性和解释性的结论。步骤一:以下是我们使用数据集cust_id fnd_rdm_amt_thr_mnt

2016-11-16 16:40:19 7911

原创 构建用户画像:(综述篇)

前面已经提到用户画像就是从各个维度,从静态和动态两个方面去描述一个用户“容貌”、“品行”、“财富”。下面就介绍一下我们的产品:

2016-11-16 11:00:23 3315 1

原创 构建用户画像: 5W2H方法(三)

Author : QQ zhou5)How? 怎样构建用户画像到这里,我们可以正式谈谈如何构建用户画像了。第一章,已经向大家介绍了从哪些纬度构建用户画像。让我们回顾一下,主要有:人口统计、地理信息、浏览信息、交易信息、渠道信息等。下面我们谈谈构建用户画像的方法,主要分为三个步骤:数据收集、行为建模、构建画像

2016-11-15 23:27:29 2667

原创 构建用户画像:5W2H法(二)

Author : QQ zhou 谁会使用?在什么时候使用用户画像? 1)企业在新产品促销、推广时 2)广告主需要向不同用户推送其可能感兴趣的广告时 3)企业评估年初、年末产品推广的效果、公司本年度运营的状况是否良好时—如价值用户是否上升

2016-11-15 18:08:32 1776

原创 构建用户画像: 5W2H方法(一)

Author : QQ zhou1) what? 用户画像是什么2) why? 为什么要了解用户画像3) where? 从什么方面了解用户画像 4) who?when? 谁可以使用用户画像,应用场景是什么5)How? 怎样构建用户画像6)How much? 价值体现:用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户贴“标签”。

2016-11-15 16:56:23 2236

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除