自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 资源 (1)
  • 收藏
  • 关注

原创 购物篮分析为什么在零售业无法普及?--Apriori算法的困境(一)

Apriori算法是布尔型模型(Boolean Model),而零售业非常注重量化经营指标,如销售金额、销量、销售价格、购物篮金额都是重点经营指标,Apriori算法对这些经营指标予以忽略,把购物篮中商品的经营指标简化为布尔型,支持度-置信度指标是一种事务出现的概率,这种概率不能对应零售业的量化经营指标,没有量化描述,算法就不能得到零售业者的欢迎。Apriori算法推出30年间,在理论层面获得了巨大的成功,但没有在国内零售界大面积落地应用,主要问题就在于量化分析实践的缺乏。为什么会出现这种令人尴尬的状况?

2023-09-04 10:34:18 164

原创 Apriori算法解析(以R语言为例)(一)

含义如下:最小值为1.000,第一四分位数(1st Qu.)为2.000,中位数(Median)均值为3.000,第三四分位数(Mean 3rd Qu.)为4.409,最大值的(Max.)为32.000,中位数代表了Groceries数据库的购物篮系数平均值为3.0。#从图3-2中看到,在交易数据集的9835个购物篮中,购物篮系数为1的交易数为2159、购物篮系数为2的交易数1643、购物篮系数为3的交易数为1299,以此类推,最大的购物篮系数为32,交易数量为1。1、#载入算法包及购物篮数据库。

2023-08-24 09:40:30 262

原创 关联分析的核心算法--Apriori算法的指标体系及实例

如何判断一个购物篮数据集合中,那些商品之间是强关联、那些是弱关联,Apriori算法方法是,对于支持度和置信度都设置一个最小值,即设置一个筛选条件(阈值),以此判断事务之间关联关系的强弱,对于上面的5个购物篮,可以设置支持度最小值为30%,置信度的最小值为50%,那么{苹果、牛奶}的关联关系就是强,其他的都是弱,可以予以忽略。国外某超市对青椒、红椒、黄椒三个蔬菜与香蕉的商品关联关系进行了分析,分析结果见表3-2,该报表运用了三个指标,用以表示青椒、红椒、黄椒与香蕉的商品关联关系。

2023-08-21 10:34:43 335

原创 经典购物篮分析--Apriori算法解析(一)

支持度计数(Sopport Conut):在一个数据集合中的某个项集出现在几个购物篮中,支持度计数就是几,比如{苹果、牛奶}出现在购物篮1、购物篮2中,所以{苹果、牛奶}的支持度计数为2,在零售业中支持度计数是一个非常重要的指标,可以表示交易集合在限定交易数据中的总量(购物篮数量),以此提示关联关系的商业价值,比如有些购物篮的关联规则看上去很强,但是购物篮总数不多,商业价值也不会太高。以上面的购物篮为例,苹果与牛奶的提升度Lift(苹果->牛奶)=P(苹果/牛奶)/P(牛奶)=40%/60%=67%。

2023-08-16 10:06:38 514

原创 购物篮分析的数据分层案例解析----(以R语言案例包的Groceries数据集为例)

Groceries数据集来自一个现实中真实存在的欧洲超市,是其经营一个月的购物篮数据,共包含9835次交易,由169个商品完成销售,按照一个月30天计算,该超市每天平均为328笔交易,根据Groceries数据集的交易笔数、商品品类构成,应该是一家社区型小型食品超市。下表来自于一个真实南方超市的交易数据,表中共有8个购物篮,购物篮中商品是真实超市售卖的商品,该超市经营面积大致在1500平米,属于标准超市,主营商品以生鲜为主,经营商品在5000个左右,每天交易笔数在2000-2500笔左右。

2023-08-10 11:05:50 586

原创 零售业的购物篮分析层级与关联规则维度

自下而上的品类跨层交叉模式:先将主分析对象确定为较低的层级,向上跨越品类层级寻找关联规则,如将主分析商品定为“嘉士伯啤酒”,将购物篮中的其他商品上升一级品类层级,如将各种规格、品牌的尿布升级为“尿布”品类,以此寻找“嘉士伯啤酒”与“尿布”的关联关系,或者寻找“帮宝适尿布”与“啤酒”品类的关联规则。品类层级对品类层级的平级关联:将购物篮中的商品进行品类升级,统一到同一层级的品类,比如“啤酒”与“尿布”就是二个同一个品类层级的关联关系,这是最常见的商品关联规则挖掘对象层级选择方法。

2023-08-07 10:12:53 97

原创 零售业的购物篮分析与品类层级选择

零售业的购物篮数据维度是最小零售单位(product level),即所谓的SKU级别,如果将这种最底层的商品单品直接进行购物篮分析,可能会出现数据颗粒度过于细小,商品之间的关联关系会被稀释,难以发现有意义的关联规则。第三级,即小分类级别,是中分类的下属管理对象,比如中分类啤酒品类下的进口啤酒、国产啤酒等,小分类级别会对应货架上具体的区域,如在啤酒货架上,有国产355ml听装燕京啤酒、也有进口640ml瓶装嘉士伯啤酒。每家零售企业的分类方式都不同,但基本会有大分类、中分类、小分类、细分类等。

2023-08-04 10:00:37 83

原创 零售关联分析(购物篮分析)的数据源及预处理(二)

近年来由于Java语言及云端数据库的普及,有些POS软件采取了Json格式进行订单数据存储,将交易数据中的Master表与detail表合并,形成统一的Json数据包,Json数据包会产生冗余、但是便于编程,Json数据包属于半结构化数据,需要转换为结构化数据(semi-structured basket data to the structured format),才可以进行购物篮分析。但是有些离群点可能具有商业价值,比如门店附近新家庭的出现,导致某些购物篮的系数突然变大,此时需要予以特别关注。

2023-07-28 10:10:42 168 1

原创 进行关联分析时需要补充的购物篮数据属性

购物篮中的商品数据是精简数据,进行分析时需要补充其他属性信息,有些数据属性既不在订单数据中、也不在门店基础数据中,需要单独补充,这些数据就是隐形属性;

2023-07-26 10:50:29 56

原创 零售关联分析(购物篮分析)的数据源及预处理(一)

每个零售业态都会有自己的购物篮形成规律,日本7-11便利店平日购物篮数量为800-1000个,节假日为1000-1200个,国内大型卖场日均购物篮数量为3000-5000个左右,节假日为7000-8000个左右。:指的是通用商品编码,是将SKU拆解到商品最小零售包装单位(MPQ:最小包装单位),Upc码含商品销售的基础信息,理论上讲是一品一码,一般也不做为POS机销售码。:商品销售编码,这是专供POS机销售时使用的商品编码,PLU码包含了商品的精简描述信息、实时有效价格及促销信息。

2023-07-21 10:37:09 321

原创 购物篮中商品关联关系的场景描述及产生原因

*摘樱桃者:**计划购买啤酒,到了门店发现大箱啤酒促销,本来想随便买点下酒菜,但大箱啤酒将双手占据,拿不了更多的东西,只能拿了促销的大箱啤酒离店,对于顾客是一笔合算的买卖、但是负毛利促销的啤酒没有购物篮的整体弥补,对于门店来说是一笔失败的买卖。**互斥商品:**原计划购买某卤菜,后发现某熟食的品相更好,于是不再购买某卤菜、取而代之购买了熟食,熟食品与卤菜形成了互斥关系。**向上销售:**计划购买啤酒,由于门店的酒类陈列、促销等原因,最终购买了葡萄酒,形成了向上销售的购物篮。

2023-07-03 10:23:37 91

原创 商品在购物篮中的八种关联表现形式(下)

在电商平台上,顾客将商品放入购物篮,不结账放弃购买的行为是大量存在,由于可以随时跟踪到顾客的全程消费轨迹,因此被放弃的购物篮被作为改进网页的商品陈列、价格策略、促销手段的数据依据,从而改善电商平台的顾客转换率、并提升销售业绩的指标。互斥商品关系,指的是一种商品出现、则另一种商品必然不出现的购物篮销售现象,商品之间的向上销售、向下销售也是互斥商品的一种表现形式,代表了商品之间的替代关系,互斥商品呈现了商品的负关联关系。有一种方法,如对比门店的客流量及转化率,逐渐累计相关数据,就可以发现被放弃的购物篮。

2023-07-01 11:25:29 105

原创 商品在购物篮中的八种关联表现形式(上)

对应商务事件之间的基本关联关系类型,零售业的购物篮中,商品之间的关联关系会出现以下八种关联表现形式:

2023-06-12 10:43:22 144

原创 购物篮中的商品关联关系与商业事件之间的关联形式

在购物篮中,商品组合会呈现不同形式的关联形式,关联形式对应了商业事件之间的关联关系。商业事件之间的关联关系,指的是商业事件之间存在着某些频繁出现的规律或模式。

2023-06-08 14:57:16 56

原创 实体门店到底需要什么样的数字化手段?-兼评某《数字化白皮书》

实体门店的数字化至今依然处于一个比较初级的阶段,门店的几乎所有设备都是智能数字化设备,可惜这些设备之间都是“数字孤岛”,相互不联通,而且各个厂商将这些数据接口视同为自己的“禁地”,都想以自己数据为中心形成数据中台,从这个角度出发,也是各个厂商难以完成统一门店数字化的根本原因。

2023-06-05 11:27:57 65

原创 购物篮分析、关联关系与关联规则

购物篮分析,英文名称为Market Basket Analysis(简称MBA),或者Shopping Cart Analysis(购物车分析)。

2023-05-26 10:45:05 337

原创 零售业的商品交叉弹性与商品替代关系

在门店的销售数据分析中,会发现有些商品之间即使没有价格变动因素,依然会出现商品销售量之间的相对变化趋势,比如一个商品的销量上升、造成另一个商品的销量下降,或一个商品的销量下降、则另一个商品的销量上升,或者是二个商品之间销量的同升同降现象。这种没有价格因素参与的商品之间指标的变化为商品交叉弹性(Cross Elasticity)或商品交叉影响(Cross Effects)

2023-05-24 09:39:48 374

原创 零售业的商品交叉价格弹性

在零售门店中,会出现某些商品之间的交叉影响现象,英文称为Cross Effects,比如一个商品的销量上升、而另一个商品的销量应声下降,或者商品之间的销量呈现同升同降的现象,当这种相互影响的形式呈现某种弹性关系时,这种关系就被称为交叉弹性(Cross Elasticity),商品之间的交叉弹性也是商品关联关系的一种形式

2023-05-22 09:28:13 387

原创 电子价签与动态价格调整算法与策略

现今的大量卖场在使用电子价签,但如果电子价签只是一个价格显示屏,没有后端的动态价格算法支撑,此时的电子价签是没有意义的

2023-05-17 10:26:59 197

原创 在进行动态价格带分析时,有哪些价格点值得重点关注?

在动态价格带分析中,有几个价格点值得重点关注:

2023-05-15 09:55:06 471

原创 零售运营之动态价格带(Pricing lining)与价格双峰带

商品销量价格带分析,是以商品的实际销售量与实际销售价格进行对比分析,计算方法为以商品的销售量为Y轴、销售价格为X轴

2023-05-09 11:12:38 312

原创 零售运营中之动态价格带(Pricing lining)分析及相关概念简介

动态价格带(Pricing lining)分析,是以商品销量与销售价格进行对比分析,以此找出商品的价格与销量的关系,由于采取了销量与价格作为分析维度,因此也被称为量价分析。

2023-05-06 09:38:17 442

原创 零售运营中的P&P之静态价格带(Pricing Tier)与定价策略分析

零售业的价格带分析是一种常用且非常有效的价格合理性分析方法,价格带分析有二种,一种是静态价格带分析,另一种是动态价格带分析。静态价格带分析指的是某品类内中所有商品的定价分布,也称为品类定价策略分析,或称为价格线(Price tier)或价格段(Price Zone)分析,用于分析某个品类在陈列商品时,给顾客形成的商品价格整体印象

2023-05-02 10:06:05 522

原创 零售运营中的P&P之价格策略(Pricing)分析

**零售业运营中有二个著名的P(P&P),**第一个P是价格(Pricing),第二个P是促销(Promtion),价格和促销是零售运营中的基础工作,需要进行持续优化,优化的过程都可以使用相关性分析予以定性、跟踪并持续改进。在这里我们先介绍第一个P,即零售价格(Pricing)。

2023-04-28 09:45:01 431

原创 那些店铺之间存在客流交换?--零售业相关性分析实例

在传统的统计分析技术中,相关性分析是一种简单、实用的分析技术。相关性分析英文名为Correlation Analysis,也可以称为Correlation Mining(相关性数据挖掘)。相关性分析方法可以衡量二组以上连续变量之间的相关性及其相关性的强弱,并用适当的统计指标表示出来。

2023-04-24 09:37:10 117

原创 与其言必称大数据,不如实用的相关指标--零售业到底需要什么样的数据科学?

某大型餐厅无法精确预估每天的就餐人数,这样会导致人员、食材安排上会出现纰漏,后来根据每天下午5:00前的预定数与当天的总就餐数存在1:5的相关性,由此将预定人数作为总就餐人数的先行指标,假定某天下午5:00前预定就餐人数是50位,那么当天总就餐人员应该是250位(注:精益数据分析 【加】阿利斯泰尔.克罗尔,本杰明.尤科维奇 著,韩知白 王鹤达 译,北京:人民邮电出版社2015.1 P49)。有经验的人都知道,零售是一个时间高度敏感的行业,不同日期、不同销售时段都会对商品销售产生巨大的影响。

2023-04-18 16:15:44 57

原创 气温升高一度、饮料一天多卖多少瓶?--门店物联网之相关分析

日本7-11很早就建立了专门的气象部,对于门店所在区域的温度、湿度、是否晴天、是否下雨、雨量大小等情况均要进行详细的记录,并在事后进行详细的分析,这种分析不仅仅是找出各种气候对门店销售业绩的影响程度,往往要找出各种气候因素会对具体商品形成什么样的影响,也就是商品与天气等因素之间的相关性关系,日本7-11便利店总部会向气象台购买3天内的卫星云图,用以预测三天内天气的变化趋势,然后按照不同商品与天气之间的对应关系,组织门店的商品进货、上架及销售。至于温度在17-20度之间时,布丁、色拉和酸奶则很受欢迎。

2023-04-16 10:25:47 250

原创 门店物联网应用与数据相关性分析

要想衡量天气因素对于业绩的影响方式,门店温度是最直观的量化指标,门店中的温度与不同的商品销售量有着最直接的相关性表现,比如门店周边的环境气温上升,会导致碳酸类饮料的销量上升,门店周边的环境气温下降,热饮类饮料的销售会上升、同时碳酸类饮料的销量会下降,这些都是零售业的温度相关性表现。对于上述问题,相关性分析是一种很好的分析及预测方法,根据以往的数据规律、可以帮助预测未来,比如可以将门店周边的温度、湿度、时间因素、体感温度等环境因素进行归纳、寻找规律,并预测可能对门店的销售业绩带来的影响。

2023-04-13 10:03:57 481

原创 商业数据分析中的“关联”与“相关”是一回事吗?

在商业数据分析领域中,严格意义上讲,“关联”与“相关”不是同一个概念

2023-04-09 09:51:32 1530

原创 “啤酒与尿布”--零售业的购物篮分析包含了哪些数据挖掘算法?

“啤酒”与“尿布”的故事仅仅依靠购物篮分析一种挖掘手段是不够的,应该加上相关性分析、时间序列分析、链接分析、推荐系统思路等,共同对购物篮数据进行挖掘

2023-04-05 10:17:38 270

原创 为什么在卖场里看不到“啤酒与尿布”?

从数据挖掘的角度衡量,“啤酒与尿布”具有很强的地域性、以及稍纵即逝的时间窗口,故事发生在美国某地大卖场、时间是大联盟赛的周五晚上,过了这个时间段,故事就不存在,因此很多卖场中看不到“啤酒与尿布”。现代卖场都是按照品类组织货架,“啤酒”与“尿布”会分别陈列在不同的货架区域,将“啤酒与尿布”陈列在一起,会形成所谓的二次陈列,没有特别的把握,卖场不会这样做、形成货架资源的浪费。很多人认为“啤酒与尿布”是个假故事,原因就是在卖场中看不到“啤酒”与“尿布”一起陈列,因此就认为这是一个营销噱头,是个假故事。

2023-03-31 09:44:44 87

原创 “啤酒与尿布”:零售门店如何了解顾客需求---Top N 还是购物篮?

很多零售业者都认为,零售门店中的商品销售排行榜起起落落,但不代表零售门店业绩的发展趋势,而购物篮的发展趋势代表了门店中最敏感的顾客需求变化,国外零售业认为,购物篮的变化是门店的心跳,国内某位超市负责人曾经说过,他们可以忽视商品在销售额上的排名,但不能忽视这只篮子里(购物篮)的细微变化。要想了解顾客的真实需求,分析顾客手中的购物篮是一条重要的路径,这是因为顾客的购买行为(Buying Habits of the customers)就隐藏在顾客手中的购物篮里。1、 了解顾客的购买行为、从而掌握顾客的需求;

2023-03-29 10:01:39 69

原创 “啤酒与尿布”:零售业中的购物篮分析与推荐系统--替代还是补充?

亚马逊是当今国际上最大的电商交易平台,为了更好地服务电商平台上的卖家(供应商与品牌方),亚马逊推出了“亚马逊品牌分析服务(Amazon Brand Analytics Service,简称ABA)“,该服务产品主要面向卖家,可以为卖家提供有价值的经营分析数据,帮助卖家更好的组织市场营销及商品组合策略,其中的购物篮分析(MBA:Market Basket AnAlysis)是ABA的重要分析工具。购物篮分析也可以应用到电商平台的运营分析,以亚马逊为例,购物篮分析是重要的后台销售分析工具。

2023-03-27 09:21:33 195

原创 “啤酒与尿布”:零售业的购物篮分析与推荐系统--替代还是互为补充?

亚马逊是当今国际上最大的电商交易平台,为了更好地服务电商平台上的卖家(供应商与品牌方),亚马逊推出了“亚马逊品牌分析服务(Amazon Brand Analytics Service,简称ABA)“,该服务产品主要面向卖家,可以为卖家提供有价值的经营分析数据,帮助卖家更好的组织市场营销及商品组合策略,其中的购物篮分析(MBA:Market Basket AnAlysis)是ABA的重要分析工具。购物篮分析也是电商平台的后端重要分析工具,以亚马逊为例,购物篮分析是重要销售分析工具。

2023-03-25 19:44:28 183

原创 “啤酒与尿布”----关联分析的由来及真实性

“啤酒与尿布”的故事是数据挖掘界的神话,这个故事是怎么产生的?是一个虚构的故事吗?

2023-03-24 16:23:51 889

[啤酒与尿布].Bear.and.Diapers.2008.Scan-HARRISON.pdf

啤酒与尿布是数据分析届的神话,指的是购物篮中的商品之间具有关联关系,我是本书的作者,与其让别人大肆发我的盗版,不如我自己上传

2021-02-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除