背景介绍
随着数据可视化分析的流行,对python的论坛进行可视化分析可以有效帮助论坛进行引流,达到优化论坛资源,分析论坛走势的目的。该程序分为数据爬虫和数据分析两个部分。该设计为我本科比耶设计。
1、论坛信息爬虫
python论坛的主页面如下图所示:
使用chrome抓包可以获得控制具体信息的链接为:https://bbs.pythontab.com/forum.php?mod=forumdisplay&fid=8&orderby=dateline&filter=author&orderby=dateline&page={num}'
其中num控制翻页的页码。
因此,使用requests库模拟浏览器访问得到具体的页面信息,并且使用pyquery库来解析相关的数据信息保存到csv中。具体的代码和结果如下:
注:数据使用jupyter打开。
2、论坛数据可视化分析
词云图分析:
问题发布年限分析:
问题回复综合分析:
上述分析完成后,结论自己说即可。
需要数据分析by设计 联系v:km_0224