一、零售关联分析的数据源
零售业是一个数据密集的行业(Retail is a data-intensive industry),用于关联分析的数据是POS机(Point-Of-Sales)产生的交易数据。
POS机产生的交易数据,也被称为Tickets data(交易票据数据)或Customer Transaction dataset(顾客交易数据集)。
POS机交易数据以销售小票为单位,一张销售小票对应一个顾客单次购买行为,也就是对应一个购物篮,如一家超市一天有1000个顾客买单,就会形成1000个购物篮。
每个零售业态都会有自己的购物篮形成规律,日本7-11便利店平日购物篮数量为800-1000个,节假日为1000-1200个,国内大型卖场日均购物篮数量为3000-5000个左右,节假日为7000-8000个左右。
在开始进行购物篮数据分析之前,先介绍几个零售业数据的常用名称;
1、Sku(stock-keeping unit):Sku编码是商品管理码,用于订货、进货、库存管理等,不能用于POS机的前端销售。
2、Upc(universal product code):指的是通用商品编码,是将SKU拆解到商品最小零售包装单位(MPQ:最小包装单位),Upc码含商品销售的基础信息,理论上讲是一品一码,一般也不做为POS机销售码。
3、 PLU(Price Look Up):商品销售编码,这是专供POS机销售时
零售关联分析(购物篮分析)的数据源及预处理(一)
最新推荐文章于 2024-06-03 10:06:24 发布
![](https://img-home.csdnimg.cn/images/20240711042549.png)