一、工具和环境
IDE:Pycharm
第三方模块
1.jieba 主要功能:处理分词
2.requests 主要功能:获取接口数据
3.sqlite3 主要功能:进行数据库相关操作
4. matplotlib主要功能:进行绘图
5.ecahrts 主要功能:数据可视化
6.flask 主要功能:web展示
7.bs4 主要功能:网页解析
环境 python3.9
浏览器:Chrome浏览器
二、数据准备阶段
该案例中的数据是通过爬虫爬取豆瓣网优秀电影前250部。数据内容涉及电影链接、名称、简介、相关信息等。
三、爬虫代码
(1)主函数
(2)访问链接
(3)获取数据
(4)连接数据库
(5)存储数据
四、词云
(1)代码
(2)结果
五、平台展示
(1)首页
(2)电影数据(部分数据)
(3)数据可视化
(4)词云
需要所有的代码可私聊