课程设计（一）

4v1d

已于 2023-06-02 18:26:09 修改

阅读量282

点赞数 2

分类专栏： Python项目文章标签：课程设计 python 开发语言

于 2023-06-02 18:02:39 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51213906/article/details/131011921

版权

Python项目专栏收录该内容

5 篇文章 1 订阅

订阅专栏

系列文章目录

一课程设计任务说明及总体设计说明
 二总体设计说明
 三核心功能与代码
 四问题与讨论

文章目录

系列文章目录
前言
1.1.题目介绍
1.2.需求分析和解决思路
- 1.需求分析
- 2.解决思路
1.3.个人所完成的核心工作内容

前言

记录回顾之前Python课程设计的点点滴滴

1.1.题目介绍

数据爬取与分析
禁忌事项：绕过网站的安全、破解密码
遵守事项：网站的robots协议，若有。
数据文件 CSV, UTF-8,分隔符：默认的逗号

1.2.需求分析和解决思路

1.需求分析

1）平台内最热门（评分标准：点赞数0.3+评论数0.7）的100个内容，主题的分布情况

2）特定分类（内容最多的某个分类）下TOP50的内容分析标题关键词分析评论内容的热词分析

3）自行探索的一些分析

2.解决思路

我一开始确认了想要爬取媒体信息内容，所以对象放在了哔哩哔哩、知乎、微博三个平台
经过许许多多头秃的代码调试后，我确认了哔哩哔哩作为研究对象
我选取哔哩哔哩里的内容为视频标题、播放量、点赞、评论等数据所想为爬取数据到数据存储，数据清洗再到数据可视化
最后呈现出来的效果就是要让不懂代码的人都看得舒服

1.3.个人所完成的核心工作内容

数据的爬取

数据的存储（整理到数据库、excel、csv等）

数据的清洗

数据的可视化（图表、词云等）

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
课程设计（一）

记录回顾之前Python课程设计的点点滴滴
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。