《数据分析实战》–用R做聚类分析
本文参考的是《数据分析实战》的第八章。
背景:针对某公司的产品,现目前需要服务好已有的用户,针对不同的用户群体设计并推广不同的营销策略。
现状:目标用户不明确。
预期:明确目标用户群。
读取数据
读取Dau数据:
> dau <- read.csv('dau.csv',header = T,stringsAsFactors = F)
> head(dau)
log_date app_name user_id
1 2013-05-01 game-01 608801
2 2013-05-01 game-01 712453
3 2013-05-01 game-01 776853
4 2013-05-01 game-01 823486
5 2013-05-01 game-01 113600
6 2013-05-01 game-01 452478
读取Dpu数据:
> dpu <- read.csv('dpu.csv',header = T,stringsAsFactors = F)
> head(dpu)
log_date app_name user_id payment
1 2013-05-01 game-01 804005 571
2 2013-05-01 game-01 793537 81
3 2013-05-01 game-01 317717 81
4 2013-05-01 game-01 317717 81
5 2013-05-01 game-01 426525 324
6 2013-05-01 game-01 540544 243
读取用户行为数据:
> user.action <- read.csv('action.csv',header = T,stringsAsFactors =