你今天喝奶茶了嘛?Python分析全国奶茶数据信息!!!

前文

      不管好不好喝,奶茶都是门好生意。立秋的第一杯奶茶热度已经过去了,但是自从奶茶诞生。打入市场营销是很成功的列子,买奶茶不需要看日子,也不贵上至老人下至小孩。到现在日常生活中,绝大部分的人都会在不同的时间买买奶茶喝。
我记得很清楚的就是学生时代有钱了就开始买奶茶喝了,和瓶装的饮料比:各种口感都有,外观也很nice,符合大家的各方面的要求。
现在上班之后。老板也时不时的奖励大家,把奶茶作为福利赠送。

奶茶这么好,今天就带大家看看它到底好在哪里。单从销量不难看出。

1.今天小编带大家用Python一键抓取奶茶门店信息!!

生意密码:一种奶茶加万物的模式

这里面的核心技术,其实是利用茶叶本身回甘的特性,让它易于与几乎任何辅料搭配,不仅不会抢味道,还能让人在喝完之后,口中残余的味道更快消褪,加上咖啡因本身的成瘾性,让人越喝越想喝。

​​

首先带大家抓取了12个热门城市的奶茶店名单,城市包括:北京、上海、广州、深圳、天津、西安、重庆、杭州、南京、武汉、成都和长沙。长沙的话特色奶茶都了解一波!!

共计68614家奶茶店,3万多个奶茶品牌。在构建抓取URL时,需要注意将城市的维度具体到城市商圈,因为每个URL最多只显示32页内容,保证抓取每个城市时的数据量是准确的。

图片

# 构建抓取URLdef get_url_1():    
for city,city_code in city_dict.items():        
for block_dict in area_dict[city]:            
for children in block_dict['children']:                
for page in range(1,33):                    
block_code = children['id']                    
offset = 32 * (page-1)                    
# print(city, area, block, block_code)                    
url = 'https://apimobile.meituan.com/group/v4/poi/pcsearch/{}?uuid=6ddabcb37fdd4a8e9cdf.1599125825.1.0.0&userid=280531290&limit=32&offset={}&cateId=-1&q=奶茶果汁&areaId={}&sort=solds'.format(city_code,offset,block_code)                    redis_db.sadd('meituan_milk', url)​

2.数据清洗

由于爬取的奶茶数量特别多,所以所以只能进行针对性清洗,对部分名气高的奶茶品牌进行了部分选择。

# 清洗字段def clean(x):   
title = re.sub(u"(.*?)", "", x['title'])    
title = title.replace('點點','点点').replace('(','').replace(')','')    
title = title.replace('一点点','1点点')    
if '一杯会说话的茶' in title:        
title = '1314一杯会说话的茶'    
elif '大卡司' in title:        
title = '大卡司DAKASI'    
elif '1点点' in title:        
title = '1点点'    
elif '都可' in title:        
title = 'CoCo都可'   
elif '书亦烧仙草' in title:        
title = '书亦烧仙草'   
elif '蜜雪冰城' in title:        
title = '蜜雪冰城'    
elif 'royal' in title or 'Royal' in title or 'ROYAL' in title:        
title = 'Royaltea皇茶'    
elif 'ALS' in title:        
title = 'ALS GONG CHA贡茶'    
elif 'GONG' in title:        
title = '贡茶'    
elif '茶百道' in title:        
title = '茶百道'    
elif '吾饮良品' in title:        
title = '吾饮良品'    
elif '悸动烧仙草' in title:        
title = '悸动烧仙草'    
elif '沪上阿姨' in title:        
title = '沪上阿姨'    
elif '7分甜' in title:        
title = '7分甜'    
elif '古茗' in title:        
title = '古茗'    elif '奈雪' in title:        
title = '奈雪の茶'    elif '悦色' in title:        
title = '茶颜悦色'    else:        
pass    return titledf['title'] = df.apply(clean, axis=1)

3.数据可视化

当小编在制作可视化图表的时候,发现有些奶茶品牌的名称极为相似,让人有一种傻傻分不清楚的感觉。

图片

“茶颜悦色”这个牌子大家应该都是很熟悉的哈,长沙的一大特色。

之前的话也是有过一段很热门的话题,也是抄袭事件。门店直接开在了旁边,晚上让你很难区分哪家才是正品,这也足以显示奶茶行业品牌竞争的激烈情况。

图片

​这是从全国12个热门城市来看奶茶店铺数量分布情况。广州是最多的,天津是最少的。

图片

从12家门店信息分析出来的,像(一点点这个门店信息是最多的)。看来大家都很喜欢到一点点点奶茶喝呀!!!

结尾

奶茶虽然好喝,但是不要喝太频繁了哈!!

【这话说出来被奶茶店看到了会不会被打死。狗头保命.jpg】

当然是又原因的啦,记得前段时间抖音刷到的一个小男孩日常一杯奶茶进了icu的。

偶尔喝喝还是没问题哈。

完整的文章项目代码可以来小白解答学习的Python交流圈:959755565 大家一起学习、成长,Figthing!!

如文章对你有帮助,“关注点赞”和评论是对我最大的支持!!

  • 3
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

顾木子吖

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值