问题发现
本部门视频号自动化团队在给某10w+视频号做自动回复工具的过程中发现,官方后台提供的数据与实际数据不符,且常常有较大的偏离度(超出一倍),故又单独制作一个数据分析程序,以供大家参考。下面直接进入正文,上数据。
正文
数据源1: 昨日数据新增评论
数据源2: 所有视频的新增评论昨日增量(可以认为是真实的评论数量)
预期结果: 昨日新增评论应该与本视频号所有视频的昨日新增评论数一致
实际结果: 常常差距达到一倍以上
设计实验:
因为官方并没有提供办法查询昨日新增评论具体是由哪些视频评论组成,故我们只能使用最传统的办法。
设计数据统计方案:每天晚上23点30分开始(抓取过程约半小时),抓取所有视频(本案例共612条视频)的全部评论数量,汇总求和。(用11月3日晚12点总评论量减去11月2日晚12点总评论量即为11月3日全天的评论数量)
实验数据:
数据源1(视频号首页昨日数据) | 数据源2(所有视频评论量增量) | 偏离度(正确值应接近1:1) | |
---|---|---|---|
11月2日 | 783 | 293 | 0.37 |
11月3日 | 2510 | 1192 | 0.47 |
11月4日-6日 | 9753 | 4801 | 0.49 |
11月7日 | 1303 | 528 | 0.41 |
11月8日 | 847 | 397 | 0.47 |
11月9日 | 1252 | 494 | 0.39 |
注:因为我们机器人每天都会推送这些数据(通常只处理部分视频而非全部),但这边的运营人员觉得这个首页昨日数据不太正常,所以单独做了全量视频评论数据抓取,检测了一周发现确实问题比较严重。
本设计可能存在的误差:
- 视频号本身统计存在的误差
- 本抓取程序抓取所用时长(半小时)期间的用户评论导致的误差(影响极小,基本可以排除)
问题猜想:
- 可能是视频号后台将部分认为质量不高或不过审的评论隐藏
- 可能有人删除了评论或未成功发出评论但被统计(影响极小,基本可以排除)
- 视频号后台的埋点处理问题或其他程序缺陷
总结
该问题已经同步反馈到微信开放平台,如果官方处理和解答后本文会更新处理结果。
顺便安利一波我们的视频号自动化工具,支持精细化评论数据展示、视频热度排名、爆款视频提醒、自动关键词回复评论、自动删除低劣评论、自动拉黑、评论自动归类等功能,还支持AI能力扩展自动回复话术等,可以私聊获取工具体验!