前阵子恰好在逛优衣库,想起来好久没在zara,hm买衣服了。就产生了分析比较一下这几家快时尚品牌的想法,那从哪方面来分析呢?考虑其他数据获取的复杂性,本次先以线下门店分布这一个侧面来看吧!本来想把GAP也纳入其中,但是数据不太好扒,就先分析这三家。
一、数据获取
本次数据获取主要来源于百度百科的门店列表。
优衣库:https://baike.baidu.com/item/%E4%BC%98%E8%A1%A3%E5%BA%93/4397542?fr=aladdin
hm:https://baike.baidu.com/item/HM/7193957
zara:https://baike.baidu.com/item/ZARA
三家百科的门店列表略有差异,利用excel与python把格式统一一下。主要包含以下几个步骤:
1) 先把三家的店铺分布直接复制粘贴到excel表格中,文件名shop_address.xlsx,包含三个sheet, sheetname分别是zara、hm、uniqlo
2)各sheet格式统一
hm与zara在百科的形式比较规范,直接粘到excel稍作简单处理即可。uniqlo(优衣库)的格式有些差异,见下图。
在同一个城市中的所有门店都在一个单元格中用逗号隔开,对其采用python处理。代码如下
data = pd.read_excel('shop_address.xlsx', sheet_name='uniqlo', header=None)
df = pd.DataFram