文章目的:
现在爬虫技术逐渐普及开来,大家都会去微博,京东等网站去爬取文本,做一些简单的词频分析。但其实我们可以爬到的信息不止文本,用户等级,发帖时间,还有一些人口背景信息。将这些信息和文本信息进行组合分析,结合对于行业的认知经验,会得出一些更有意思的洞察。与单纯的词频分析相比,这样的分析,更能帮助我们得到立体的用户形象,对于品牌,产品和用户的认知更加的深入,也对业务决策也更有帮助。
数据来源:
本文出现的数据都是从微博和京东等公共平台进行爬取,不涉及到任何品牌内部数据,是任何人都可以获取的文本和数据资源
本文产出:
本文章利用从微博和京东爬取的信息,对用户,品牌,产品进行文本和数据分析,解答了品类总体的用户特征,同品类不同品牌下的用户特征差异,帮助保健品牌了解自己在社交媒体上的用户组成和在购物网站上客群特征。
微博人群数据:
- 性别比例:女性对于男性,占到近7成
提及三个品牌微博用户的性别比例存在一定差异,
- 具体而言,汤臣倍健微博的女性占比最高为80%,明星代言吸引大量女性粉丝群体;
- 而提及康宝莱和纽崔莱的微博用户中性别比例接近,均为6:4左右
- 粉丝质量:
- 汤臣倍健:
汤臣倍健用户中,粉丝量为百万级和千万级的用户占比7%,显著高于纽崔莱和康宝莱,这些用户分别是营销号、蔡徐坤工作室和汤臣倍健官微,其中与明星相关的账号创造了较大的微博互动量和影响力。
- 康宝莱:
提及康宝莱的微博中粉丝量过万及十万级的用户占比共33%,比其他品牌明显更多(10%),综合这部分用户的微博互动情况与其粉丝数比例可推测这部分用户的粉丝大部分均为“僵尸粉”,粉丝数量与微博互动频率并不成正比。
- 纽崔莱:
提及纽崔莱的微博中粉丝量多的用户占比更少,百万级粉丝用户除了安利官方账号就只有几个媒体平台官方微博,绝大多数纽崔莱微博用户都是个人账号
- 用户背书:粉丝中的大V用户比例
- 三个品牌微博用户中,企业官方认证的占比大致相当,在3%-6%之间
- 而个人认证的用户占比差异较大,表现在汤臣倍健微博用户中个人认证的黄V用户占比44%,而康宝莱和纽崔莱仅有12%-15%的用户是黄V用户
(一般所说的大V以及自媒体、营销号等都是黄V个人认证)
- 这表明官方账号在微博不一定有更权威的影响力,反而是网络红人、各领域知名博主以及自媒体账号可以带动更多的流量和互动量
京东用户特征:
京东店铺截图:在以下店铺爬取的用户评论
三个保健品牌的京东会员等级分布
三种品牌的用户中会员分布比例大致相同,plus会员占比最高(不排除京东优先展示plus的评论,导致了爬虫抓取的plus用户评论占比较多)
购买汤臣倍健用户中plus会员略多于纽崔莱和康宝莱,而购买康宝莱的用户中铜牌会员及注册会员相对较多,可能这部分用户并不经常使用京东
用户手机型号分布
苹果用户购买康宝莱多:
对比购买三种品牌商品用户使用的手机系统发现:
- 购买汤臣倍健和纽崔莱的用户中,安卓用户占大多数(60%左右),苹果用户仅占到30%-40%左右;
- 而购买康宝莱产品的用户中苹果用户(48%)略多于安卓用户(45%),而苹果用户特征为年轻化、女性多于男性
用户评论时间分析
康宝莱用户发帖时间行为突出:有四个发帖高峰时期
康宝莱:
- 康宝莱用户也存在4个发帖高峰,具体为上午9点、中午13点、下午16点和晚上22点,
- 上午9点发帖数量最多,与上班通勤时间相对应
- 此外,晚上22点也是康宝莱用户的发帖小高峰,且晚上21点之后康宝莱用户明显更活跃
表明可能康宝莱用户明显偏年轻化,其发帖活跃时间与年轻人的生活作息相匹配
汤臣倍健:
- 存在4个发帖小高峰,分别是上午10点、中午12点、下午16点以及晚上19点
- 其中晚上19点发表评论数最多
- 从21点之后发表评论数明显少于另两个品牌;
整体上看汤臣倍健用户更集中在白天发表评论
纽崔莱:
- 纽崔莱用户喜欢在上午9点、中午11点、下午16点和晚上19-20点发表评价
整体上看纽崔莱用户的发帖时间在一天内相对平缓,随时间变化的起伏不大
康宝莱更有效的吸引到年轻女性的用户
在综合考虑了微博内容,产品定位,发帖时间,用户特征几个因素来看,相比其他两个保健品牌,至少在社交媒体和购物网站的社交行为来看,推测康宝莱的女性群体占比较大,也能成功的鼓励和引导了女性用户在社交媒体上发表和品牌相关的内容,创造了产品偏女性的舆论氛围