python是哪个国家的品牌,爬取全国12个热门城市奶茶店铺情况,看看你的城市哪个品牌最多...

e01a81d4f3d8889447903af6397fc1fb.png

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

以下文章来源于CSDN ,作者Gordon,Alice

fa0b0092c6551a2e1e2a4c4e5a5e8873.png

Python 数据分析实战讲解案例

https://www.bilibili.com/video/BV1954y1r7pi/

前言

现在越来越多年轻人手里的那一杯快乐肥宅水,从可乐换成了奶茶。上世纪80年的奶茶并不像现在的奶茶口味繁多,配料多样,而大部分80、90后童年的奶茶只有一个名字,那就是“台湾珍珠奶茶”。只需要一间几平方米的小店,一台手动封杯口机器,几罐不同口味的奶茶粉末,就可以开一家奶茶店。

奶茶起源于中国北方游牧民族,知名于中国台湾。早期的台湾奶茶品牌,如CoCo、50岚、老虎茶等等。前两家CoCo和50岚(现在的1点点)都已经成为中国大陆大型的连锁奶茶店。随着奶茶越来越受大众喜爱,涌现出更多的本土奶茶品牌,如蜜雪冰城、益禾堂。再到如今的网红时代,由于不同奶茶品牌的口味差异不大,如何更好地营销自己的奶茶品牌,让消费者能从众多奶茶中翻到自己的牌子,变得更加重要。例如奈雪的茶主打高端路线,奶茶均价在40元左右;喜茶主打品牌差异化,注重茶饮口感的同时营造店面排长龙的“时尚文化”。

41a405e5d0e6783ad4857b4117b7bc6f.png

数据获取

本文数据来源于美团网,抓取了12个热门城市的奶茶店名单,城市包括:北京、上海、广州、深圳、天津、西安、重庆、杭州、南京、武汉、成都和长沙。共计68614家奶茶店,3万多个奶茶品牌。在构建抓取URL时,需要注意将城市的维度具体到城市商圈,因为每个URL最多只显示32页内容,保证抓取每个城市时的数据量是准确的。

数据清洗

数据清洗部分,主要清洗了奶茶店铺名称,虽然数据均来源于美团网,但是同一个奶茶品牌会有多种格式,如1点点和1點點,大卡司和大卡司DAKASI。由于奶茶品牌数量众多,并且真假难辨,所以只能进行针对性清洗,对部分名气高的奶茶品牌名称要保证其统一。

#清洗字段

defclean(x):

title= re.sub(u"(.*?)", "", x["title"])

title= title.replace("點點","点点").replace("(","").replace(")","")

title= title.replace("一点点","1点点")if "一杯会说话的茶" intitle:

title= "1314一杯会说话的茶"

elif "大卡司" intitle:

title= "大卡司DAKASI"

elif "1点点" intitle:

title= "1点点"

elif "都可" intitle:

title= "CoCo都可"

elif "书亦烧仙草" intitle:

title= "书亦烧仙草"

elif "蜜雪冰城" intitle:

title= "蜜雪冰城"

elif "royal" in title or "Royal" in title or "ROYAL" intitle:

title= "Royaltea皇茶"

elif "ALS" intitle:

title= "ALS GONG CHA贡茶"

elif "GONG" intitle:

title= "贡茶"

elif "茶百道" intitle:

title= "茶百道"

elif "吾饮良品" intitle:

title= "吾饮良品"

elif "悸动烧仙草" intitle:

title= "悸动烧仙草"

elif "沪上阿姨" intitle:

title= "沪上阿姨"

elif "7分甜" intitle:

title= "7分甜"

elif "古茗" intitle:

title= "古茗"

elif "奈雪" intitle:

title= "奈雪の茶"

elif "悦色" intitle:

title= "茶颜悦色"

else:pass

returntitle

df["title"] = df.apply(clean, axis=1)

数据可视化

当笔者在制作可视化图表的时候,会发现有些奶茶品牌的名称极为相似,让人有一种傻傻分不清楚的感觉。

类似的奶茶品牌名称

0b11b629ac96f40401965dfd7a58263b.png

例如喜茶的前身“Royaltea皇茶”,因为皇茶这个商标无法注册版权,只能加前缀或后缀,所以就出现了“世代皇茶”,“雅岛英皇茶”等等的同胞“兄弟”。正是饱受这种侵权而不能诉诸法律的情况,聂云宸才会想到直接弃了皇茶这个品牌,改名为喜茶。无独有偶,“贡茶”这个牌子也被各种盗版,而且部分盗版牌子居然还有主页官网,让你很难区分哪家才是正品,这也足以显示奶茶行业品牌竞争的激烈情况。

热门城市奶茶店铺数量情况

6ed0d17e37b5b69d2f184fd7857fc491.png

从全国12个热门城市来看奶茶店铺数量分布情况,广州的店铺数量是最多的,拥有11419家,之后是深圳(9367家)、上海(7940家)、成都(7361家)。4个一线城市中,北京的奶茶店只有4643家,笔者猜测因为北京位于北方,并不像南方一年四季几乎都是热天,而奶茶主要是作为冷饮,尤其现在最流行的奶盖茶,只适用于冷饮,过热的水温会导致奶盖融化。还有一点原因是,由于茶树的生长发育需要大量水分,对空气湿度和降水量均有比较高的要求,所以国内茶叶的产地主要集中在南方,相应的运输成本也有价格优势,因此相较于南方的热门城市,北京、天津奶茶店铺的数量相对较少。

奶茶品牌店铺数量 TOP15

cf11d70e352cba6a89b02a9b8ef91dbd.png

在这12个热门城市中,总共有3万多个奶茶品牌,最为消费者所熟悉的奶茶品牌有1点点和CoCo,它们都拥有超过1500家门店,并且都是存活了10多年的老品牌。此外,书亦烧仙草、蜜雪冰城和贡茶这些也都是有上千家门店的奶茶品牌,它们的门店都喜欢开在一起,类似于麦当劳和肯德基。一旦你在某个城市商圈看到其中一家奶茶店,在几百米的距离内肯定能找到上述的某几家奶茶店。

特色奶茶分布情况

ad259bd0a8af307b1173aa1524be1cae.png

有些奶茶店很有自己的地域特色,如果你想品尝它们的原版奶茶,就可能需要跑到别的城市才能喝到,因为它们大部分分店都只开在本土城市。例如“吾饮良品(I Drink)”大部分分店开设在武汉。“茶颜悦色”的店面93.57%在长沙。“沪上阿姨”虽然生在上海,却火在天津,分店总数有208家,而上海只有6家分店。“古茗”的分店主要集中在杭州和重庆,“茗”象征着茶,因为这2个城市是盛产茶叶的地方。如果大家到了这些城市,记得打卡喝一杯原汁原味的奶茶。

大众奶茶分布情况

5d63ca499ffe9427ae85b3d8858a1d46.png

接下来介绍一下大众奶茶中的1点点,CoCo,书亦烧仙草和益禾堂的热门城市分布情况,因为笔者在广州经常能看到这几家店,而且店面都是挨得很近。1点点和CoCo在上海的分店数量都是最多的,而书亦烧仙草在成都和长沙比较普遍,益禾堂则是在广州和深圳。这4家奶茶品牌在广州分店数量均有上百家,也难怪走到哪都能看到这几家奶茶店。

奶茶品牌均价情况

4ca252d159b14665c8300fc4cc9de058.png

“奈雪の茶”和“喜茶”作为近期最火的新式网红茶饮,前者人均消费39元,后者约31元。而大部分奶茶品牌的均价在10-17元,之所以这两家奶茶品牌均价会这么高,原因在于它们采用了“茶饮+”的营销方式,除了近30元一杯的奶茶外,还有吐司,甜品和咖啡等搭配产品,而其它品牌只是单纯销售各式各样的奶茶。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值