【四 (1)数据可视化之如何选用正确的图表】

文章导航

【一 简明数据分析进阶路径介绍(文章导航)】

一、数据分析中可视化的作用

1、揭示数据关联和模式

可视化可以直观地展示数据之间的关联和模式,帮助人们发现隐藏在数据背后的故事和趋势。

2、支持数据分析和决策

通过可视化工具,用户可以更好地理解和分析数据,发现其中的模式和趋势,从而做出更准确、有依据的决策。

3、提升沟通和共享效果

可视化可以将复杂的数据信息以直观、易懂的方式展示,使数据传达更加有效。同时,它也可以帮助人们更好地表达和分享数据,促进沟通和理解,避免信息的误解和歧义。

4、强调关键信息和发现

通过可视化,可以将关键信息和发现突出显示,使其更加显眼和易于理解。这有助于人们聚焦在数据中最重要的部分,减少冗余信息,提高数据理解的效率。

5、增强故事叙述和记忆效果

可视化可以帮助人们通过图形和图表的方式讲述一个故事,使数据更具有说服力和记忆效果。

6、有效增强数据交互性数据

可视化鼓励用户探索和操控数据,从而发现其中的奥秘。与静态图表相比,它提供了更高的交互性和动态性。

7、复杂信息易理解

人类大脑处理视觉信息的速度比书面信息快10倍。因此,使用图表总结复杂的数据可以确保比混乱的报告或电子表格更快地理解关系。

8、数据多维度显示

在可视化分析中,数据可以进行分类、排序、组合并显示每个维度的值,以便可以看到表示对象或事件数据的多个属性或变量。

二、如何选用合适的图表

选择合适的图表类型需要考虑数据的特点、目标受众的需求以及传达的信息,需要兼顾以下几点

1、简洁性避免使用过于复杂或繁琐的图表,以免使读者感到困惑。选择简单明了的图表类型,突出关键信息。

2、可读性确保图表易于阅读和理解。使用清晰的标签、图例和颜色编码,以帮助读者快速理解图表内容。

3、数据准确性确保图表中的数据准确无误,并避免误导读者。

4、目的明确在选择图表之前,明确你的目的和受众。不同的图表类型适用于不同的目的和受众,因此需要根据实际情况进行选择。

5、可视化图表分类

类型用途图形
对比类图形主要用于展示不同类别或组之间的数据对比关系柱形图、条形图、子弹图、雷达图、词云图、哑铃图、棒棒糖图等
趋势类图形用于展示数据随时间或其他变量的变化趋势折线图、范围面积图、面积图、散点图、瀑布图等
分布类图形主要用于展示数据的分布情况散点图、地图、热力区域图、漏斗图、直方图、核密度图等
关系类图形用于展示两个或多个变量之间的关系散点图、气泡图、流程图、甘特图、组织结构图、矩阵图等
占比类图形主要用于展示数据的占比或比例关系饼图、环形图、玫瑰图、百分比堆积柱形图、百分比堆积条形图、树百分比瀑布图、堆叠柱状图、旭日图、漏斗图等
地理类图形用于展示地理数据或空间分布的数据常见的地理类图形包括地图、热力图、点密度图等

三、python可视化包及其优缺点

名称介绍优点缺点适用场景
MatplotlibMatplotlib 是 Python 中最常用的 2D 绘图库,提供了各种绘图工具,如线图、柱状图、散点图、饼图等广泛支持:适用于多种操作系统和平台。
高度可定制:可以精细控制图表的每一个细节。
集成性:与其他 Python 库(如 NumPy、Pandas)集成良好。
复杂度高:相对于其他库,API 可能较为繁琐。
静态图表:主要侧重于静态图表,交互性较弱。
适用于需要高度定制和精细控制图表的场景,如科学研究、数据报告等
SeabornSeaborn 是基于 Matplotlib 的一个统计图形库,专注于绘制具有吸引力的统计图形美观:内置了多种预定义的主题和样式,使得图表更美观。
统计导向:专注于统计图形,适合数据分析和探索。
易用性:API 相对简单,易于上手。
交互性弱:和 Matplotlib 一样,Seaborn 主要侧重于静态图表。
定制性差:虽然美观,但在定制方面可能不如 Matplotlib 灵活。
适用于数据分析、数据探索和可视化报告,特别是需要美观和统计导向的图表
PlotlyPlotly 是一个交互式绘图库,支持创建各种动态和交互式的图表交互性:提供了丰富的交互功能,如缩放、平移、悬停提示等。
多平台支持:支持 Web、桌面和 Jupyter Notebook 等多种平台。
图表类型多样:支持多种图表类型,如散点图、热图、3D 图等。
学习曲线:API 可能较为复杂,需要一些时间来适应。
性能:在处理大量数据时,性能可能不如其他库。
适用于需要创建交互式图表的场景,如 Web 应用、数据仪表板等
PyechartsPyecharts 是一个用于生成 Echarts 图表的 Python 库。Echarts 是一个使用 JavaScript 编写的开源可视化库,Pyecharts 提供了 Python 接口美观:Echarts 的图表美观且高度可定制。
交互性:支持丰富的交互功能,如数据缩放、数据过滤等。
集成性:可以轻松地将图表嵌入到 Web 应用中
依赖 JavaScript:图表是在客户端渲染的,需要用户的浏览器支持 JavaScript。
文档和学习资源:相对于其他 Python 可视化库,文档和学习资源可能较少。
适用于需要创建美观且交互性强的 Web 图表的场景,如数据仪表板、Web 应用等

四、常见图表样式

1.1、条形图

在这里插入图片描述

1.2、堆叠条形图

在这里插入图片描述

1.3、百分百堆叠条形图

在这里插入图片描述

2、直方图

在这里插入图片描述

3、折线图

在这里插入图片描述

4、面积图

在这里插入图片描述

5、饼图

在这里插入图片描述

6、环形图

在这里插入图片描述

7、玫瑰图

在这里插入图片描述

8、热力图

在这里插入图片描述

9、雷达图

在这里插入图片描述

10、桑葚图

在这里插入图片描述

11、词云图

在这里插入图片描述

12、地图

在这里插入图片描述

13、仪表盘

在这里插入图片描述

14、水球图

在这里插入图片描述

15、箱型图

在这里插入图片描述

16、K线图

在这里插入图片描述

  • 12
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
项目介绍 该项目选用了和鲸社区关于数据分析岗位的数据集来进行分析。项目主要使用“job.csv”文件作为数据源,其中数据文件的主要栏位有职位、城市、公司、薪资、学历、工作经验、行业标签。其中本项目所使用的可计算的栏位为最低薪资、最高薪资、平均薪资、奖金率。 本项目所使用的可分类的栏位为职位、城市、学历、工作经验、行业标签。通过对数据进行清洗重塑和分析,再使用plotly等工具进行绘图,实现图表的交互式数据可视化,最后使用flask框架(利用了bootstrap)进行网页上的可视化展示。最后展示了关于数据分析岗位的人才需求分布情况、薪资情况以及发展前景。 项目来源:选用boss直聘网站的数据分析职位的招聘数据 数据结果总结 通过以上分析,可以发现,如果要成功进入数据分析行业,应该往北上广深行这几个城市考虑,这些城市的薪资水平高。 而行业方面应该着眼于互联网及电子商务等新兴行业,这些行业对该岗位的需求都比较大,而且薪资水平也普遍高。 该岗位对学历的门槛并不是很高,从市场需求来看,要求硕士的较少,而博士则是凤毛麟角。本科是一个分水岭。是否是本科,对薪资水平的影响还是很大的 不过这也从侧面反映了社会上学历的分布状况,本科生及大专生占绝对多数。 虽然市场需求量大,但是本科生就业压力也很大 工作经验对于该岗位而言非常重要,能否成功进入数据分析行业的关键门槛在于是否有工作经验,与薪资水平呈正相关。 而成功进入数据分析行业以后,只有在迈过3年这个坎,才会有比较大的突破。
HomeAboutDesignlol.netAdmin ARCHIVED ENTRIES FOR 数据可视化 九 27 前言:数据可视化是怎样创造出来的。可视化 Tags: 数据可视化, 信息可视化 13 Comments » 我多次被炫目的数据可视化信息可视化震惊,在我知道这些图片背后的数据来源和创造历程后,更是为之诧异不止。它涉足制图学、图形绘制设计、计算机视觉、数据采集、统计学、图解技术、数型结合以及动画、立体渲染、用户交互等。相关领域有影像学、视知觉。空间分析、科学建模等。 这是创造性设计美学和严谨的工程科学的卓越产物。用极美丽的形式呈现可能非常沉闷繁冗的数据,其表现和创作过程完全可以称之为艺术。所以我翻译了来自SM上的3篇数据可视化信息图形的文章,主要是鉴赏并提供一些参考资料。我尽量查找了每张数据图表背后的背景,添加了标注和说明,希望那个帮助读者更深入地理解这些图表所呈现的含义,而不仅仅是停留于对“好看”的赞叹上。这些图片不会说话,但它们比文字和语言都更为有力。 数据可视化 Data Visualization 和信息可视化 Infographics 是两个相近的专业领域名词。狭义上的数字可视化指的是讲数据用统计图表方式呈现,而信息图形(信息可视化)则是将非数字的信息进行可视化。前者用于传递信息,后者用于表现抽象或复杂的概念、技术和信息。 而广义上的数据可视化则是数据可视化信息可视化以及科学可视化等等多个领域的统称。 数据可视化起源于1960s计算机图形学,人们使用计算机创建图形图表可视化提取出来的数据,将数据的各种属性和变量呈现出来。随着计算机硬件的发展,人们创建更复杂规模更大的数字模型,发展了数据采集设备和数据保存设备。同理也需要更高级的计算机图形学技术及方法来创建这些规模庞大的数据集。随着数据可视化平台的拓展,应用领域的增加,表现形式的不断变化,以及增加了诸如实时动态效果、用户交互使用等,数据可视化像所有新兴概念一样边界不断扩大。 而我们熟悉的那些饼图、直方图、散点图、柱状图等,是最原始的统计图表,它们是数据可视化的最基础和常见应用。作为一种统计学工具,用于创建一条快速认识数据集的捷径,并成为一种令人信服的沟通手段。传达存在于数据中的基本信息。所以我们可以在大量PPT、报表、方案以及新闻见到统计图形。 但最原始统计图表只能呈现基本的信息,发现数据之中的结构,可视化定量的数据结果。 面对复杂或大规模异型数据集,比如商业分析、财务报表、人口状况分布、媒体效果反馈、用户行为数据等,数据可视化面临处理的状况会复杂得多。 可能要经历包括数据采集、 数据分析、数据治理、数据管理、数据挖掘在内的一系列复杂数据处理,然后由设计师设计一种表现形式,是立体的、二维的、动态的、实时的还是允许交互的。然后由工程师创建对应的可视化算法及技术实现手段。包括建模方法、处理大规模数据的体系架构、交互技术、放大缩小方法等。动画工程师考虑表面材质、动画渲染方法等,交互设计师也会介入进行用户交互行为模式的设计。 所以一个数据可视化作品或项目的创建,需要多领域专业人士的协同工作才能取得成功。人类能够操纵和解释如此来源多样、错综复杂跨领域的信息,其本身就是一门艺术。 数据可视化在发展过程中,科学和工程领域的应用衍生出了分支:科学可视化——“利用计算机图形学来创建视觉图像,帮助人们理解科学技术概念或结果的那些错综复杂而又往往规模庞大的数字表现形式”。 在计算机诞生之前,科学的可视化行为就存在。如等高线图、磁力线图、天像图等等。利用计算机的强大运算能力,人类可以使用三维或维的方式表现液体流型、分子动力学的复杂科学模型。 比如利用经验数据,科学可视化在天体物理学(模拟宇宙爆炸等)、地理学(模拟温室效应)、气象学(龙卷风或大气平流)模拟人类肉眼无法观察或记录的自然现象;利用医学数据(核磁共振或CT)研究和诊断人体;或者在建筑领域、城市规划领域或高端工业产品的研发过程中发挥重大重用。比如汽车的研发过程中,需要输入大量结构和材料数据,模拟汽车在受到撞击时如何变形。在城市道路规划的设计过程中,需要模拟交通流量。 虽然科学可视化的表现形式对于普通人比较陌生,像粒子系统、散点图、热力图等图表不接受专业训练很难看懂。但实际上科学可视化的成果已经渗透到我们生活的每个角落。 90年代初期,信息可视化领域进入人们的视野。用于解决对异质性数据中“抽象”的部分的分析。帮助人们理解和观察抽象概念,放大了人类的认知能力。 科学可视化信息可视化的差别比较微妙,因为科学可视化的大部分处理对象都是抽象的概念。在手段和技术上也有大量共同之处。所以边界比较模糊。 在国外,许多大型企业、科研机构都会有相关部门进行数据可视化研究,如数字图书馆。媒体和政府机构也会对自己掌握的数据进行可视化分析,如犯罪地图。在互联网上,那些掌握了大量用户活动信息、用户关系网或语料库的网站,比如digg,friendfeed,flickr或大型电子商务网站等,都有实验性的可视化项目。可惜在中国在这方面的商用或实验项目还是比较空白的。 数据可视化的开发和大部分项目开发一样,也是根据需求来根据数据维度或属性进行筛选,根据目的和用户群选用表现方式。同一份数据可以可视化成多种看起来截然不同的形式。 有的可视化目标是为了观测、跟踪数据,所以就要强调实时性、变化、运算能力,可能就会生成一份不停变化、可读性强的图表。 有的为了分析数据,所以要强调数据的呈现度、可能会生成一份可以检索、交互式的图表 有的为了发现数据之间的潜在关联,可能会生成分布式的多维的图表。 有的为了帮助普通用户或商业用户快速理解数据的含义或变化,会利用漂亮的颜色、动画创建生动、明了,具有吸引力的图表。 还有的图表可以被用于教育、宣传或政治,被制作成海报、课件,出现在街头、广告手持、杂志和集会上。这类图表拥有强大的说服力,使用强烈的对比、置换等手段,可以创造出极具冲击力自指人心的图像。在国外许多媒体会根据新闻主题或数据,雇用设计师来创建可视化图表对新闻主题进行辅助。 说了那么多,大家都可以感受到数据可视化所应用价值,其多样性和表现力吸引了许多从业者,而其创作过程中的每一环节都有强大的专业背景支持。无论是动态还是静态的可视化图形,都为我们搭建了新的桥梁,让我们能洞察世界的究竟、发现形形色色的关系,感受每时每刻围绕在我们身边的信息变化,还能让我们理解其他形式下不易发掘的事物。 我通过翻译这系列的文章,为数据可视化的创造力所折服,也为其所能诞生和发展的背景环境所感叹。希望国内能有更多的跨领域人才的教育背景,能有发展实验性项目的环境,设计师们能拥有更多的创造力和专业素养,永远保持好奇心和敏感。 数据可视化相关的引擎/程序/工具(来自wiki百科) Instantatlas Data Desk DAVIX Eye-Sys Ferret Data Visualization and Analysis GGobi IBM OpenDX IDL (programming language) Style Intelligence OpenLink AJAX Toolkit ParaView Smile (software) StatSoft Visifire VisIt VTK Yoix Prefuse 信息可视化的相关方法 Cladogram (phylogeny) 分支图 Color alphabet 色彩字母表 Dendrogram (classification) 树状图 Information visualization referen

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值