大数据Python
文章平均质量分 51
大数据开发基础结课后,Python3.0学习以及爬虫,包括爬取信息、可视化等
JJU~
这个作者很懒,什么都没留下…
展开
-
大数据Python爬取B站电影排行榜——数据可视化
文章目录前言一、数据可视化是什么?二、使用步骤1.引入库、包2.折线图3. 条形图4. 饼图总结前言通过爬取数据—>数据清洗, 最后把数据可视化,呈现数据的可视化效果,该文章主要是制作了简单的数据可视化:折线图、条形图和饼图。除此以外一般的数据可视化还可以包括:词云图、一、数据可视化是什么?顾名思义:可视化就是可以通过视觉进行传达的。 再专业一点就可以解释为可视化(Visualization)是利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,再进行交互处理的理论、方法原创 2021-11-24 09:04:22 · 2712 阅读 · 1 评论 -
大数据Python爬取B站电影排行榜—数据清洗
文章目录前言一、数据清洗是什么?二、我的代码呈现1.引入包2.读入数据3.数据清洗总结前言接上一篇数据爬取的信息进行数据清洗。一、数据清洗是什么?数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查 数据一致性 ,处理无效值和 缺失值 等。 与问卷审核不同,录入后的数据清理一般是由计算机而不是人工完成。 数据清洗 (Data cleaning)– 对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供 数据一致性 。二、我的代码呈现1.引入包代码如下(示原创 2021-11-24 08:54:52 · 865 阅读 · 0 评论 -
大数据Python爬取B站电影排行榜——爬取信息
大数据Python爬取B站电影排行榜前言一、配置环境二、爬取B站电影排行榜top1001.找到B站电影排行榜top100网页2.用URL进行爬取信息三、建立Excel表并导出总结前言通过学习《大数据基本开发与实验》课程,完成对B站电影排行榜的爬取,并进行数据预处理和可视化分析。一、配置环境该项目需要配置Python3.0环境,我采用的是二、爬取B站电影排行榜top1001.找到B站电影排行榜top100网页找到B站电影排行榜top100的页面,对该页面的源代码进行分析。(点击右键,即可查看源原创 2021-11-24 08:35:57 · 3051 阅读 · 8 评论