本分析数据集采用Kaggle的E-commerce data。
数据分析思路:Kaggle-Customer Segmentation
数据导入详见:数据分析初阶——数据导入
数据初步处理详见:数据分析初阶——数据初步处理
1. 各变量初步探索
在进行数据分析前,需要先对各个字段做简单的了解。
InvoiceNo:订单号。如果在单号前有加C,意思是这个订单是一个取消订单。
StockCode:商品代码。如果是同一商品则是唯一的。
Description:商品描述。
Quantity:订单商品数量。
InvoiceDate:订单日期。
UnitPrice:商品单位价格。
CustomerID:客户ID。
Country:客户所在国家。
1.1 国家
SELECT Country,count(*) FROM ecom.data
GROUP BY Country
对Country计数,结果如下:
表1 订单国籍分布计数(部分)
Country | United Kingdom |