自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 【异动分析】归因分析

指标波动,正常吗?是什么因素的影响,影响了多少?我该做什么?

2024-12-26 10:20:10 460

原创 【数据分析】活动效果评估

平台做了一个用户增长的活动来进行拉新,如何评估活动效果?活动的好坏,想要得出的结论有3部分:1、这个活动效果是好还是坏?2、这个活动的价值大小,可不可以继续做3、这个活动有哪些可以优化的地方步骤。

2024-12-19 11:27:39 713

原创 【AB实验】实验上线不达预期

评估策略效果,AB实验有收益,但上线后无收益,可能是什么原因呐?

2024-12-18 19:34:39 270

原创 【预估分析】新产线预估

现在要在一个新城市开拓滴滴网约车业务,需要预估一下需要,如何预估?

2024-12-18 11:15:12 235

原创 【归因分析】GMV下降

Q:某电商平台发现最近一周gmv下降了20%,你会如何做异动归因分析。

2024-12-18 10:54:29 513

原创 【归因分析】分层分析

某产品用户中有10000人使用Android设备,5000人使用iOS设备,且细分看到iOS用户付费率为4%,而Android付费率5.5%、那在有限资源下,我们是不是应该建议主要投放Android用户,以获取更多付费用户转化?对辛普森悖论有了解的同学,应该很快能想到,出现这个情况可能是用户分层结构变化导致的,即高支付率的用户占比在下降,导致总体水平下降。出现一开始的荒谬建议,是因为我们忽略了总体数据是由于各设备类型加权得到的,结构差异可能比付费率本身的差异对总体的影响更大。

2024-12-17 19:37:06 174

原创 【归因分析】关联性分析

A类目参加大促,B类目没有参加,却发现B类目的自然流量和转化率都提升了,这背后可能的原因是?

2024-12-17 19:24:59 345

原创 XGBoost学习

下面是一个使用Python实现的简单XGBoost分类任务示例,包括数据预处理、模型训练、评估和预测的基本步骤。此示例使用了著名的鸢尾花(Iris)数据集,该数据集可以直接从sklearn库获取。XGBoost广泛应用于推荐系统、信用评分、疾病预测等多个领域。通过实例分析,我们可以直观感受到其在实际问题解决中的强大威力。

2024-06-20 16:16:49 317

原创 【python】数据仿真法

数学仿真法计算平均获得一名五星角色的概率是多少?该概率与基础概率相比有多大区别?保底机制: 最多90次抽奖必定获得一个五星角色。一般概率: 抽中五星角色的基础概率为0.6%

2022-08-12 13:24:39 783

原创 商家看板指标体系

商家看板指标体系

2022-01-27 13:43:15 472

原创 hive 同比&环比&对比

hive 同比&环比&对比

2021-12-16 18:14:33 1469

原创 hive 常用数据类型01

hive 数据格式01一级目录二级目录三级目录一级目录二级目录三级目录

2021-12-15 15:28:29 1520

原创 【hive】时间函数01

月份第一天,最后一天,一月多少天select trunc('2021-12-13','MM');select last_day('2021-12-13');select (datediff(last_day('2021-12-13'), trunc('2021-12-13','MM')) + 1) days;返回值:2021-12-012021-12-3131当天:select current_date()select '${zdt.addDay(-1).format("yyyy

2021-12-13 18:06:09 2921

原创 常用数据分析框架

常用数据分析框架

2020-05-20 15:54:44 581

原创 Intellij IDEA15 编写Python

Intellij IDEA15:建立Python 工程原文地址 https://blog.csdn.net/weixin_41659384/article/details/80636535五个步鄹:1)Windows中Python安装2)Intellij IDEA15中Python安装3)Intellij IDEA15建立Python项目4)编辑Python脚本5)安装pipWindows中Python安装:Intellij IDEA15中Python安装:Intellij IDEA

2020-05-12 13:42:31 290

原创 Python数据分析入门 matplotlib数据可视化基础【三】

分析特征内部数据分布与分散状况绘制直方图主要用户查看各分组数据的数量分布,以及各个分组数据之间的数量比较可比较直观地看出产品质量特性的分布状态,便于判断其总体质量分布情况可发现分布表无法发现的数据模式、样本的频率分布和总体的分布bar函数的常用参数及其说明绘制饼图倾向于查看各分组数据在总数据中的占比可比较清楚地反映出部分与部分、部分与整体之间的比例关系,易于显示每组数据相对于总数...

2020-04-28 22:36:32 622

原创 Python数据分析入门 matplotlib数据可视化基础【二】

Python 入门 matplotlib数据可视化基础【二】分析特征之间的关系绘制散点图三级目录绘制折线图绘制散点图任务实现分析特征之间的关系绘制散点图三级目录绘制折线图绘制散点图任务实现...

2020-04-27 15:29:18 944

原创 Python数据分析入门 matplotlib数据可视化基础【一】

matplotlib数据可视化基础掌握绘图基础语法与常用参数掌握pyplot基础语法创建画布与创建子图添加画布内容分析特征之间的关系二级目录三级目录分析特征内部的数据分布与分散状况二级目录三级目录掌握绘图基础语法与常用参数掌握pyplot基础语法import matp;ot;ib.pyplot as pltpyplot基本绘图流程:创建画布与创建子图plt.figure :创建一个空...

2020-04-26 22:36:13 1742

原创 利用numpy进行统计分析

numpy 统计分析排序 sort去重 unique重复数 repeat tile累计和、累计积

2020-04-25 14:44:54 895

原创 HSQL like和rlike区别【HIVE SQL】

hive中like、rlike的使用方法

2020-04-22 17:59:43 3733

原创 HSQL替换空格【HIVE SQL】正则表达式使用

hive sql替换空格正则表达式regexp_replacetrim

2020-04-21 16:52:03 6085

原创 SQL 累计和

SQL 累计和

2020-04-09 15:56:39 252

原创 SQL 当天在当月、当季度、当年的时间进度

SQL 当天在当月、当季度、当年的时间进度

2020-04-03 14:12:55 3019

原创 SQL 【hive建表&导入数据】

SQL insert overwriteinsert into create创建 导入 表

2020-04-02 19:01:59 1380

原创 python数据分析入门【numpy】

numpy array函数 切片 索引 排序 随机数

2020-03-30 17:28:56 741

原创 python数据分析入门【前菜】

python入门知识:基本知识点、元组、列表、字典等

2020-03-27 17:06:49 823

原创 SQL 周数据对比(本周VS上周)

用sql计算本周和上周同期区别

2020-03-26 16:41:22 9159

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除