数据分析业务题

1. 找出欺诈概率最高的相关地址及用户

题目:通常电商诈骗行为都有一定关联性。已知大量历史用户收货地址及某些欺诈用户信息。请使用适当算法找出欺诈概率最高的相关地址及用户。叙述其解决思路。

答案:首先收货地址可以解析出对应的经纬度,按照经纬度可以划分出1200m*600m的很多网格,取出来最近半年的该网格的所有的地址,首先利用dbscan剔除噪声点,然后对地址分词,利用tfidf把地址转化为向量,再利用Kmeans聚类。
输入:簇的数目k和包含n个对象的数据集。
输出:k个簇,使平方误差准则最小。
步骤:

  • i.任意选择k个对象作为初始的簇中心;
  • ii.计算其它对象与这k个中心的距离,然后把每个对象归入离它“最近”的簇;
  • iii.计算各簇中对象的平均值,然后重新选择簇中心(离平均值“最近”的对象值); 重复第2第3步直到簇中心不再变化为止。

2. 用户分析

题目:用户分析是电商数据分析中重要的模块,在对用户特征深度理解和用户需求充分挖掘基础上,进行全生命周期的运营管理(拉新—>活跃—>留存—>价值提升—>忠诚),请尝试回答以下3个问题:
① 用户第一单购买的行为往往反映了用户对平台的信任度和消费能力。现在数据库中有一张用户交易表order,其中有userid(用户ID)、amount(消费金额)、paytime(支付时间),请写出对应的SQL语句,查出每个用户第一单的消费金额。
答案

SELECT userid, amount
FROM (
SELECT userid, amount, MIN(paytime)
FROM order
GROUP BY userid
)

② 当你发现本月的支付用户数环比上月大幅下跌(超30%),你会如何去探查背后的原因?请描述你的思路和其中涉及的关键指标.
答案
支付用户数 = 浏览用户数×支付率

面对本月支付用户数环比上月下跌30%的情况,首先要判断这是不是我们的问题。是不是上个月是双十一,所以销售额异常的高?或者是不是本月突然爆发了世界范围的经济危机?如果是这种情况,那么电商平台会不可避免地受到影响。

如果支付用户数下跌是个问题,那么是浏览用户少了还是支付率下降了?
如果是浏览用户少了,那么核心是找出哪些人群的浏览用户数下跌了。是新用户还是老用户?如果是新用户的问题,是不是渠道引流做的不够好?那么是哪个渠道出了问题呢?可以通过查看渠道的新增用户数查找问题;如果在渠道没发现问题,那是不是产品策略最近调整了? 可以查找产品迭代前后的浏览用户数进行对比分析。
如果是支付率下降了,那么是哪个用户群体的支付率下降了?是有强烈下单需求但未下单的人群,还是购买频次≥10但超过一个月未访的忠实客户流失了?这个可以根据用户分层中的不同用户层逐一分析。
通过不同维度、不同人群的拆分,把大的问题慢慢细化,落实到具体的指标上,找出问题所在。

③ 为了更好的理解用户,我们通常会基于用户的特征对用户进行分类,便于更加精细化的理解用户,设计产品和运营玩法,请你设计对应的聚类方法,包括重点的用户特征的选择及聚类算法并说明其基本原理和步骤.
答案
重点用户特征:用户年龄,用户性别,家庭成员数,用户薪资,购买物品类别
聚类算法:K_means聚类算法
步骤:1).初始化类别数K,同时选取K个聚类中心点
2).分别计算每个样本点与K个聚类中心点的欧式距离,将样本点分配到距离最小的类别中,重新确定聚类中心,依次循环,直到聚类中心点不再改变时循环结束。

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值