1.前言
b站不同往日,越来越难搜索到想要资源原因如下
- 很多重复搬运视频
- 很多机构多号视频多号重发
- 现有b站搜索过于陈旧难以搜到想要的视频
由于以上原因, 推荐、高流量的质量却参差不齐,有三个解决方案
- 借助数据分析平台寻找高质量视频
- 通过python爬虫+数据分析结合数据挖掘技术
- 通过看AC戏言或其他up的收藏夹
2.现有b站数据分析平台推荐
- 新站
可以免费检索视频,需要注册使用,可以通过自创筛选,评论数和弹幕数、以及弹幕、评论分析参考性很大。
3.python爬虫+数据分析+数据挖掘技术
3.1可能需要的技术
- requests
- scrapy
- numpy
- pandas
- matplotlib
3.2 需要重点关注的点
- 评论数、弹幕数。
- 弹幕、评论分析(词云)。
- 异常流量分析,如短时间无意义弹幕、评论,比如是否通过发资料,骗评论