![](https://img-blog.csdnimg.cn/c4145b76180745e48dc7ac345e5cffe1.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
数据可视化
文章平均质量分 89
以python为例,结合python三剑客入门数据可视化
m 宽
致力于量化数据研究,辅助编程开发,数据挖掘与分析,策略模型构建,从微观量化到宏观基本面,从百草园到三味书屋。
展开
-
【数据分析与挖掘】数据预处理
数据挖掘过程中,数据预处理占整个过程的60%,主要分为以下四个步骤:数据清洗的主要目的是为了删除原始数据集中的无关数据、重复数据、平滑噪声数据、处理缺失值、异常值等。处理缺失值的方法可分为三类:删除数据、数据插补和不处理,常见的数据插补方法见下表:插值法有:Hermite插值、分段插值、样条插值法,而最主要的有拉格朗日插值法和牛顿插值法。1.1.2 牛顿插值法1.2 异常值处理在数据预处理时,异常值是否提出,需要根据具体情况,有些异常值可能蕴含某些信息。数据挖掘需要的数据往往分布在不同的数据原创 2023-03-26 22:29:36 · 2008 阅读 · 1 评论 -
【数据可视化】第五章—— 基于PyEcharts的数据可视化
pyecharts是一个用于生成 Echarts 图表的类库,是一款将Python与Echarts相结合的强大的数据可视化工具,使用pyecharts可以让开发者轻松的实现大数据的可视化。官网 https://pyecharts.org/#/zh-cn/introPyecharts是一个用于生成Echarts图表的库。代码相对简洁,可以生成Echarts风格的图表。◾丰富的可视化类型。原创 2022-12-08 15:56:25 · 8423 阅读 · 3 评论 -
【数据可视化】第四章—— 基于pandas的数据可视化(pandas基本操作)
图形绘制的代码:链接:https://pan.baidu.com/s/1pgS60sry6XDILIhth8bAvA?pwd=abcd提取码:abcd。原创 2022-12-02 14:52:42 · 517 阅读 · 0 评论 -
【数据可视化】第四章—— 基于pandas的数据可视化(pandas数据结构)
❓为什么要学习pandas❓NumPy已经能够帮助我们处理数据,能够结合matplotlib解决我们数据分析的问题,那么pandas学习的目的在什么地方呢?NumPy能够帮我们处理处理数值型数据,但是这还不够,很多时候,我们的数据除了数值之外,还有字符串,还有时间序列等,所以,NumPy能够帮助我们处理数值,但是pandas除了处理数值之外(基于NumPy),还能够帮助我们处理其他类型的数据。原创 2022-12-02 11:15:48 · 1048 阅读 · 0 评论 -
【数据可视化】第三章——数据可视化综合实践
作业:根据Matplotlib作业数据.csv做出4种不同类型的组合图像要求:根据情况适当添加信息,如:标题,坐标轴信息,图例信息,特殊值标注等。可参考制作内容包括并不限于:评分最高的20部电影的投票人数分布(柱状图,条形图)不同国家2012-2016年发行电影数量(折线图,簇状柱形图)不同类型电影2012-2016年发行数量(簇状柱形图)不同类型电影所占比值(饼图)电影时长分布分析(直方图)电影时长,豆瓣评分与投票人数的相关关系(气泡图)原创 2022-11-25 17:35:29 · 1644 阅读 · 0 评论 -
【数据可视化】第二章——基于matplotlib的数据可视化
Matplotlib: 最流行的Python底层绘图库,,名字取材于MATLAB,模仿MATLAB构建Matplotlib库的效果 http://matplotlib.org/gallery.html为什么要学习matplotlib?1.能将数据进行可视化,更直观的呈现2.使数据更加客观、更具说服力1️⃣ Matplotlib库由各种可视化类构成,内部结构复杂,受Matlab启发。2️⃣matplotlib.pyplot是绘制各类可视化图形的命令子库,相当于快捷方式。3️⃣pyplot中的每一原创 2022-11-22 10:26:37 · 569 阅读 · 0 评论 -
【数据可视化】第一章——了解NumPy库的基本原理
使用Python中的扩展库,可以较为轻松的实现数据可视化。一般来讲,Python可视化的实现以numpy库和matplotlib库为基础,除此以外,还有一些其他的可视化库,如pandas库、seaborn库、Bokeh库以及pyqtgraph库等。1️⃣NumPy是一个开源的Python科学计算基础库,主要用于数据分析,在进行数据可视化时,常常需要使用到NumPy库中的计算功能。NumPy库中最核心的部分是ndarray对象。它封装了同构数据类型的n维数组,它的功能将通过演示代码的形式呈现。原创 2022-11-22 09:49:19 · 817 阅读 · 0 评论