- 博客(5)
- 收藏
- 关注
原创 电商用户分析与聚类(Python)
核心活跃度指标:Last_Login_Days_Ago(最近登录天数(越小越活跃))->R、Purchase_Frequency(购买频率)->F、Time_Spent_on_Site_Hours(网站停留时长)、Pages_Viewed(浏览页数)| **重要价值客户** | 高 | 高 | 高 | 最近活跃、高频购买、高消费金额 - VIP客户 || **重要发展客户** | 高 | 低 | 高 | 最近活跃、低频但高消费 - 潜力客户 |(1) **用户活跃度分析**:不同用户群体的活跃程度如何?
2026-03-27 21:08:57
237
原创 Web新功能用户点击率AB-test数据分析
数据处理(Numpy,Pandas),统计检验(Scipy),可视化(Pyecharts),忽略错误(warnings)本质是优化我的数据:这里为什么要计算点击率:因为点击率是我后续评判的一个关键点,是我后续会用到的点,我需要得到这个数据。结构性问题:Tidy Data原则(每个变量为一列,每个观察值为一行,每种类型的观察单位为一个表格"的规范)3.5 处理异常值(建议最后进行,因为需要基于完整的、清理过的数据来识别真正的异常值)内容性问题:缺失数据,重复数据,异常值,不一致数据等。
2026-01-20 16:36:29
334
原创 记录数据分析学习历程之AB测试
8.假设检验(原假设,备择假设,原假设是想要结果的相反面,这里使用的是反证法,而备选假设可以理解为原假设,<a拒绝原假设,>a不能拒绝原假设)(了解5种检验类型:独立双样本 Z 检验、独立双样本 t 检验、Welch's t 检验、)5.流量分割与随机化(分流,分层,分流+分层):分流是分人,分层是分页面,所谓流量即人流量。3.实验所需样本量计算(可以用这个工具,在原有A比率上,增加B比率,需要的人数)。9.前后端埋点逻辑与实现(AB测试分组包括用户ID哈希分组,随机分组,分层抽样)
2025-12-21 17:51:03
211
原创 error: failed to push some refs to ‘https://github.com/wjktxw/-.git‘hint: Updates were rejected ...
git push origin main出错,关键可能是main
2025-11-29 17:27:36
336
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅