前 言
当前,互联网全球化、移动设备普及化、物质世界网络化等,都在为“数据大爆发”储蓄能量,大数据已成为继云计算、物联网之后信息产业又一次颠覆性的技术变革。大数据时代正在变革着我们的生活、工作和思维,如何让大数据更有意义,使之更贴近于大多数人,最重要的手段之一就是数据可视化。数据可视化是关于数据视觉表现形式的技术,这种视觉表现形式被定义为:一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。
数据可视化是信息时代人们对于逻辑思维形象化需求的产物,在数据呈现爆炸式增长,社会快速发展的潮流中,数据的处理是很重要的一个研究方向,其中数据可视化是数据处理中的一个重要方面。数据可视化工具种类繁多,主要包括图表类工具(如D3、Tableau、Power BI)和高级分析工具(如R、Python、Weka)。其中Tableau是一个商业智能可视化工具,它将数据连接、运算、分析和图表相结合,简化了数据可视化流程,提升了数据可视化的易读性。
“让每个人都成为数据分析师”是大数据时代的要求,数据可视化恰恰从侧面缓解了专业数据分析人才的缺乏。Tableau、Microsoft、SAS、IBM等企业纷纷加入数据可视化的阵营,在降低数据分析门槛的同时,为分析结果提供更炫的展现效果。为了进一步让大家了解如何选择合适的数据可视化产品,本书将围绕这一话题展开,希望能对正在选型中的个人和企业有所帮助。
截至2020年5月份,Tableau Desktop的最新版本是2020.2,该版本的功能有较大幅度的提升,提供全新的数据模型,简化复杂的数据分析,无需编码或脚本语言技能,客户可以更轻松地跨多个数据表回答复杂的业务问题。该版本还提供指标功能,这是新的移动优先方式,供客户即时监测关键绩效指标,大大提升了Tableau的数据处理能力和分析能力。本书正是基于此版本编写的,全面详细的介绍了Tableau在数据分析与可视化方面的主要应用。
本书的内容
第1章介绍数据可视化概述,常用的数据可视化软件,以及Tableau Desktop软件概况,Tableau系列包含的7种子工具,软件的新增功能、开始页面、数据类型及转换、运算符及优先级、文件类型等。
第2章介绍Tableau如何连接到文件:包括Microsoft Excel、Microsoft Access、文本文件、JSON文件、PDF文件、空间文件和统计文件;如何连接到关系型数据库:Microsoft SQL Server、MySQL、Oracle、PostgreSQL、IBM DB2和MemSQL;如何连接到MongoDB非关系型数据库,以及其他数据源。
第3章详细介绍Tableau的基础操作:包括工作区的操作、维度和度量及其转换、连续和离散及其转换、数据及视图的导出等操作。
第4章详细介绍Tableau的常用高级操作,包括创建字段、表计算、创建参数、函数等,使用的数据源是“商品订单表.xlsx”。
第5章介绍如何使用Tableau生成可视化视图,包括简单视图和复杂视图,如条形图、饼形图、直方图、折线图、气泡图、树状图、散点图、箱形图、环形图和倾斜图。此外还详细介绍了统计分析的可视化,包括相关分析、回归分析、聚类分析和时间序列分析等。
第6章介绍可视化的基本要求,Tableau仪表板及如何创建,以及如何使用Tableau创建故事,发布可视化视图的步骤。
第7章介绍Hadoop分布式计算框架,Tableau连接Cloudera Hive、MapR Hive的基本条件和主要步骤,以及如何优化连接性能。
第8章介绍Tableau在线服务器,包括如何注册试用和激活,如何快速搜索内容和设置账户,如何设置用户的角色和权限,如何创建和管理项目等。
第9章介绍Tableau在电商行业的实战,分别从客户价值主题分析、商品配送分主题析、商品退货主题分析和商品预测主题分析等4个方面进行可视化分析。
本书的特色
1.内容实用,讲解精炼
本书是一本比较实用的Tableau著作,详细介绍了软件大部分重要和实用的功能,对于初学者来说帮助较大,书中详细说明了可视化分析的每一步操作,便于读者练习实践。
2.由浅入深、循序渐进
本书从Tableau简介、连接数据源、基础操作、高级操作、数据可视化分析到Tableau在线服务器,逐步深入,从易到难,由浅入深,循序渐进,适合各个层次的读者参阅。
3.案例丰富,高效学习
本书在介绍软件功能的同时,基本都是结合实际案例进行操作,同时,为了使读者快速提高数据分析的整体能力,在本书的最后,详细介绍了Tableau在电商行业中的实战。
本书的读者对象
本书的内容和案例适用于互联网、银行证券、咨询审计、能源等行业的数据分析人员,以及媒体、网站等数据可视化分析的用户,可供高等院校相关专业学生以及从事数据分析的研究者参考使用,也可以作为Tableau软件培训和自学的教材。