自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 收藏
  • 关注

原创 对京东开展外卖业务的一些思考

成熟市场不是没有机会,但门槛主要在“用户”和“商家的切换成本”上,用户不是缺平台,而是缺足够理由去换平台。从业务角度拆开来看,京东切入外卖兼具吸引力&可行性。

2025-05-07 20:53:31 103

原创 AB测试面试题

AB实验流程以一个实际的业务场景去描述AB实验流程,限定场景来减少和面试官的信息差,确保沟通高效可以以自己简历上某个相关项目的场景来举例,或者以面试的岗位对应的业务来举例子。不能光自己说,要让面试官参与进来,引导面试官往自己熟悉的内容提问,从被动转为主动。回答要有逻辑性,简洁、准确的表达。还是延用之前提到的项目案例,假设之前抖音拍摄页面中右下角相册功能的icon 由相册图标改为 用户相册的最新一张照片这个案例写在了我的简历中。

2025-05-07 20:10:39 372

原创 在电商业务中,发现某商品销量突然下降,你会从哪些方面进行数据分析找出原因?

核实下降数据是否可靠,与业务部门统一数据口径,同比/环比分析确定下降范围是否处于异常波动范围?

2025-05-05 10:47:06 74

原创 某书店的客流量减少,你会如何进行分析?

客群流失:需求转移(线上/竞品)+到店动机减弱商品失焦:选品错配+价格/库存竞争力不足体验降级:环境/服务未满足线下核心价值(如社交、沉浸感)外部挤压:商圈生态变化+技术/政策冲击通过“数据定位问题→维度拆解归因→优先级排序”三步法,快速锁定核心矛盾(如“年轻客群杯文创店分流+畅销书更新慢”),针对性优化选品、体验或营销策略。

2025-05-05 10:26:44 59

原创 如何构建电商用户画像?请举例说明构建过程和应用场景

电商用户画像通过“数据采集-标签建模-分群应用-动态迭代”闭环,将用户从模糊群体转化为可识别、可触达的精准个体,实现营销ROI提升、推荐效率优化与用户体验升级,最终驱动流量价值与商业增长的最大化。

2025-05-05 09:05:03 89

原创 数据分析之Excel使用指南

如何自定义数据格式,比如这里8月销售大于7月销售,将其显示为绿色并添加向上的箭头,8月销售小于7月销售,将其显示为红色并添加向下的箭头。选择需要设置数据格式的区域,右键点击设置单元格格式,输入如下的格式代码,该代码可分为两部分,用分号隔开,第一部分是对大于0的值设置格式:[绿色][>0]▲0,表示字体颜色为绿色,显示▲,0表示原数,第二部分是对小于0的值设置格式:[红色][<0]▼0,表示字体颜色为红色,显示▼,0表示原数。[绿色][>0]▲0;[红色][<0]▼0。

2025-04-28 13:02:39 87

原创 数据分析之电商行业指标总结

公式:LTV=平均客单价 * 年均购买次数 * 平均留存年数比如奶茶店会员年均消费20次,客单价30元,平均留存2年:LTV=30 * 20 * 2=1200元用于对比获客成本用于指导补贴力度(用户值1200元,那么花300元拉新不亏)

2025-04-28 13:01:58 85

原创 基于MySQL和tableau的淘宝用户购物行为数据分析

为提高平台GMV和实现精细化运营,本项目首先使用MySQL(实际上是用Navicat Premium连接了MySQL,方便数据导入)对来自某电商的数据集进行数据预处理,然后通过多维度拆解,从用户和商品两个大的角度分别进行分析,最后借助Tableau搭建仪表盘实现数据可视化。本数据集包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。

2025-04-28 12:58:42 130

原创 数据分析中的各类分析模型

后来,人们发现这种「关键少数」的现象非常普遍,比如说:20%的原因导致80%的问题,20%的产品贡献80%的业绩,20%的员工贡献80%的业绩,20%的客户贡献80%的业绩,应用到企业中时,意味着80%的利润通常来自于20%的项目或重要客户。大家应该都听过这样一个经典案例:超市里经常会把婴儿的尿不湿和啤酒放在一起售卖,原因是经过数据分析发现,买尿不湿的家长以父亲居多,如果他们在买尿不湿的同时看到了啤酒,将有很大的概率购买,从而提高啤酒的销售量。两个推广渠道带来不同的用户,哪个渠道的注册转化率高?

2025-04-28 11:04:32 48

原创 数据分析之统计学基础知识

z-score 标准化(zero-mean normalization)也叫标准差标准化,该方法使得经过处理的数据符合标准正态分布,即均值为0,标准差为1,其转化函数为:y=(x−μ)/σ,其中μ为所有样本数据的均值,σ为所有样本数据的标准差。调和平均是把n个数字的倒数的和作为分母,把n作为分子的值,只有在数据为正值时才能计算。中值在年收入和储蓄额等的集中趋势的度量中被使用,虽然年收入和储蓄额多的人只是少数,但由于金额极大,平均值也很大,能看出与普通人的感觉有距离,这时就可以采用中值。

2025-04-28 10:47:58 58

原创 数据分析师-概率论与数理统计-基础

多维随机变量是由多个单维随机变量组成的向量。XX1X2XnXX1​X2​...Xn​联合分布 (Joint Distribution):联合概率 P(X=x,Y=y)(离散型) 或 联合概率密度函数 f(x,y)(连续型),描述两个或多个变量的联合行为。

2025-04-28 10:45:55 47

原创 数据分析之指标异动case

数据分析之业务面试case

2025-04-28 10:14:43 333

原创 淘宝用户购买行为数据分析

为优化在线零售业务的客户管理和营销策略,本项目通过使用电商行业常见指标对用户购买行为进行分析,并实施RFM模型,对客户行为进行细分,以科学定位客户生命周期和价值,促进个性化营销策略的制定。

2025-04-15 22:44:03 127

原创 电商-广告投放效果分析(KMeans聚类、数据分析)

假如公司投放广告的渠道很多,每个渠道的客户性质也可能不同,比如在优酷视频投广告和今日头条投放广告,效果可能会有差异。现在需要对广告效果分析实现有针对性的广告效果测量和优化工作。本案例,通过各类广告渠道90天内额日均UV,平均注册率、平均搜索率、访问深度、平均停留时长、订单转化率、投放时间、素材类型、广告类型、合作方式、广告尺寸和广告卖点等特征,将渠道分类,找出每类渠道的重点特征,为加下来的业务讨论和数据分析提供支持。

2025-04-14 16:58:27 90

原创 电商-美妆销售数据分析(matplotlib可视化、数据分析)

数据为天猫双十一女性美妆的数据集,围绕产品及其销量和评论撰写。数据具有7个特征,可以从多个维度解析文本。由于是真实的商业数据,所以做了匿名处理,数据集中对店名的引用被处理为产品的品牌名以保护店家隐私。数据包括27599行和7个特征变量。update_time 统计时间id 产品编号title 产品名称price 交易价格sale_count 销量comment_count 评论数量店名 店铺名称可参考的探索方向:购买化妆品的客户的关注度(评论数)是多少?各产品销量分布情况?

2025-04-12 17:50:13 138

原创 电商-母婴市场消费数据分析(pyecharts可视化、数据分析)

政策Politics:国家发展改革委2013年5月28日表示,13个部门将出台系列政策措施,从可信交易、移动支付、网络电子发票、商贸流通和物流配送共5个方面支持电子商务发展,有利于促进在线母婴商品市场快速发展。经济Economy:随着国内经济的稳定增长,2015年我国城镇居民可支配收入增长到31195元,同期农村居民可支配收入增长到11422元。不断提高的人均可支配收入将提升家庭的消费意愿,2015年中国母婴行业市场规模有望达到2万亿。

2025-04-11 18:07:50 79

原创 电商-超市销售数据分析与报表

通过对各类数据进行项目实战,让同学们了解如何对数据进行分析,如何利用pandas、numpy库等高效地进行数据分析

2025-04-11 09:25:46 95

原创 数据分析之AB测试---实操常见问题及处理方法

AB实验流程以一个实际的业务场景去描述AB实验流程,限定场景来减少和面试官的信息差,确保沟通高效可以以自己简历上某个相关项目的场景来举例,或者以面试的岗位对应的业务来举例子。不能光自己说,要让面试官参与进来,引导面试官往自己熟悉的内容提问,从被动转为主动。回答要有逻辑性,简洁、准确的表达。还是延用之前提到的项目案例,假设之前抖音拍摄页面中右下角相册功能的icon 由相册图标改为 用户相册的最新一张照片这个案例写在了我的简历中。

2025-03-31 20:39:03 153 2

原创 数据分析之AB测试基础知识

在 A/B 测试中,零假设是两组的指标是相同的,当假设检验推断出两组指标不同,但事实上两组指标相同时,就是第一类错误。

2025-03-18 16:13:06 145 1

原创 数据分析之异动分析的一般流程

请你想象如下场景:上午,10:00am,你刚到公司,运营同学火急火燎地找你——现在我们应该马不停蹄开始按照逻辑树去拆解异动原因?nonono,先让他完整地复现一遍他是用的什么看板,是怎么筛选的条件,这个指标的口径是什么,少了那么多,具体是指少了多少?举个例子,如果说本来昨天的完单数也就是10单的水平,即使少了50%变成5单,这是不是再正常不过了?以上三种情况分别对应问题不同的严重程度。需要注意:不能单纯看日周月报表中趋势图的走势,要结合波动的幅度来看,幅度越大,说明出现的异常问题越值得注意。

2025-03-17 19:55:24 193

原创 零基础小白 跟我一起学统计学常用模型(数据分析师版)

数据分析常用的统计学模型

2025-03-17 19:47:57 109

原创 数据分析之Excel数据透视表

如下为排版后的学生成绩直方图,由直方图可以看出,成绩在451-500分的学生人数最多,也就是说,本次考试学生成绩基本集中在400-550分,而高分段551-600分、601-650分以及651-700分人数较少,反映出一次考试成绩处于高分的考生在少数,处于低分的考生占三分之一左右,绝大部分考生的考试成绩在一个中位水平。Excel在数据整理、数据分析、图表制作方面有着得天独厚的优势,不仅可以对数据做清洗,而且,还能对特定数据做分析,挖掘数字背后的意义,并且,支持多种图表类型的创建,将数据具象化。

2025-03-09 19:38:02 185

原创 Python-Numpy库之数组操作与计算

对于多维数组,它的通用计算公式如下,即结果数组中的每个元素都是:数组a的最后一维上的所有元素与数组b的倒数第二位上的所有元素的乘积和: dot(a, b)[i,j,k,m] = sum(a[i,j,:] * b[k,:,m])。**numpy.ravel() 展平的数组元素,顺序通常是"C风格",返回的是数组视图(view,有点类似 C/C++引用reference的意味),修改会影响原始数组。这些排序函数实现不同的排序算法,每个排序算法的特征在于执行速度,最坏情况性能,所需的工作空间和算法的稳定性。

2025-03-08 13:09:15 81

原创 基础学习之Python-Numpy库

数据分析中常用python-numpy库,本篇文章对numpy库的基础知识进行了一个简单的概述

2025-03-08 09:57:40 84

原创 python基础知识

python基础知识,包括python数据类型、三大控制流等基础语法知识

2025-03-05 14:32:45 58

原创 利用Python-Pandas库进行数据分析基础操作

通过调用pandas库中的各种方法,实现对数据进行预处理、分组聚合、排序等操作

2025-03-05 13:06:52 138

原创 基础学习Python-Pandas库

学习python之pandas库

2025-03-04 17:13:28 189

原创 跟着我一起学习MySQL高级应用

MySQL高级应用,包括窗口函数、偏移分析函数、日期函数等

2025-03-03 12:39:45 768

原创 零基础学习MySQL基础,新手小白一起集合喽!!!

零基础学习MySQL基础

2025-02-25 16:28:37 955

原创 Efficient Differentially Private Secure Aggregation for Federated Learning via Hardness of Learning

联合机器学习利用边缘计算从网络用户数据中开发模型,但联合学习中的隐私仍然是一个主要挑战。虽然已经提出了使用差异隐私的技术来解决这一问题,但也带来了自身的挑战,即需要可信的第三方,或者添加太多噪声来生成有用的模型。目前也有使用多方计算的安全聚合技术来消除对第三方的需求,但计算成本很高,尤其是在规模上。基于以上背景,本文提出了一种新的联合学习协议,该协议利用了一种基于带错误学习技术的新型差异专用恶意安全聚合协议。

2025-02-21 20:44:08 1502

原创 浅谈后门攻击

后门攻击小白一枚

2025-02-21 20:40:17 556

原创 Latex公式大合集来啦!

Word使用Latex语法插入公式代码大合集来啦!

2023-10-28 15:56:12 2436 1

原创 pytorch中TensorDataset与DataLoader的使用

Datatset\TensorDataset\DataLoader

2023-05-23 19:29:45 559 1

原创 FedPAQ: A communication-efficient federated learning method with periodic averaging and quantization

学习笔记之FedPAQ: A Communication-Efficient Federated Learning Method with Periodic Averaging and Quantization

2022-12-09 14:25:17 2202 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除