自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 电商用户分析与聚类(Python)

核心活跃度指标:Last_Login_Days_Ago(最近登录天数(越小越活跃))->R、Purchase_Frequency(购买频率)->F、Time_Spent_on_Site_Hours(网站停留时长)、Pages_Viewed(浏览页数)| **重要价值客户** | 高 | 高 | 高 | 最近活跃、高频购买、高消费金额 - VIP客户 || **重要发展客户** | 高 | 低 | 高 | 最近活跃、低频但高消费 - 潜力客户 |(1) **用户活跃度分析**:不同用户群体的活跃程度如何?

2026-03-27 21:08:57 237

原创 Web新功能用户点击率AB-test数据分析

数据处理(Numpy,Pandas),统计检验(Scipy),可视化(Pyecharts),忽略错误(warnings)本质是优化我的数据:这里为什么要计算点击率:因为点击率是我后续评判的一个关键点,是我后续会用到的点,我需要得到这个数据。结构性问题:Tidy Data原则(每个变量为一列,每个观察值为一行,每种类型的观察单位为一个表格"的规范)3.5 处理异常值(建议最后进行,因为需要基于完整的、清理过的数据来识别真正的异常值)内容性问题:缺失数据,重复数据,异常值,不一致数据等。

2026-01-20 16:36:29 334

原创 记录数据分析学习历程之AB测试

8.假设检验(原假设,备择假设,原假设是想要结果的相反面,这里使用的是反证法,而备选假设可以理解为原假设,<a拒绝原假设,>a不能拒绝原假设)(了解5种检验类型:独立双样本 Z 检验、独立双样本 t 检验、Welch's t 检验、)5.流量分割与随机化(分流,分层,分流+分层):分流是分人,分层是分页面,所谓流量即人流量。3.实验所需样本量计算(可以用这个工具,在原有A比率上,增加B比率,需要的人数)。9.前后端埋点逻辑与实现(AB测试分组包括用户ID哈希分组,随机分组,分层抽样)

2025-12-21 17:51:03 211

原创 error: failed to push some refs to ‘https://github.com/wjktxw/-.git‘hint: Updates were rejected ...

git push origin main出错,关键可能是main

2025-11-29 17:27:36 336

原创 git bash无法用ctrl+v以及shift+insert实现复制

git bash无法用ctrl+v以及shift+insert实现复制

2025-11-29 16:28:11 115

电商用户行为分析与聚类

电商用户行为分析与聚类

2026-03-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除