如何利用Watson Analytics进行数据探索

原创 2016年06月01日 15:15:30

引言

本文内容正式开始之前,先插播一则新闻。Watson Analytics的新版本v2已经正式发布上线了。大家可以通过本文最后的试用链接进行注册试用。值得注意的是,新版本除了和以前一样提供免费版试用之外,还提供了专业版的30天试用许可。Watson Analytics专业版允许接入更多种类的数据源,处理更大量的数据,使用更大的存储空间,还可以连接社交媒体数据等等。欢迎有兴趣的朋友来尝鲜。

上期文章《如何使用Watson Analytics获取更优质的数据》告诉大家,Watson Analytics可以自动获取数据,并对数据质量评分,便于用户轻松评估数据质量,并进行数据优化。本期文章我们会介绍,如何利用这些经过优化的数据,更快速、自动化地进行数据探索,以便更敏捷的获取业务价值。

数据探索到业务洞察

Watson Analytics是一款基于云平台的自动化智能数据探索工具,它可以快速开启您的数据探索之旅。它的智能自动化分析能力能够助您加速获得您关注的业务问题的答案。它还可以帮您以故事的形式将分析洞察呈献出来。较之业界以往其它的分析工具,都需要通过手工数据加工、处理来获得分析洞察的方法,您现在可以完全将注意力放在业务理解及与同伴有效协作、沟通之上,数据加工、图形展示、可视化呈献的事情完全交给Watson Analytics来做就好。甚至,您只需要以自然语言的方式简单输入您的业务问题,Watson Analytics就会立即以可视化的综合分析结果来阐述业务问题的答案了。当然,您还可以在这些页面上进行交互操作,调整您的分析展现,获得最终的业务问题分析结论。

  • Watson Analytics可以自动分析您的数据,并以提问的方式供用户选择。
  • 您可以使用自然语言提出您关于数据的问题。
  • 您可以基于已有的分析结果进行深入探索,挖掘更多的业务洞察。

这里给大家提供一个Watson Analytics试用版,有兴趣的朋友可以试试!

示例体验

下面我们通过一个实际的例子体会Watson Analytics的数据探索能力。

1. 登录Watson Analytics(您可以通过本文最后章节的试用链接注册,并得到免费试用版本)。

2. 加载数据。

这次我们还是选择上期文章使用的数据集American Time Use Survey data set。这是来自美国劳工部的关于美国劳工时间使用统计的一个数据集。

如下图所示,红框中的图标即是已经加载的数据。我们可以看到系统对这个数据集的综合评分为62分。

watson analytics

3. 创建数据探索。

单击上图红框中的数据集,可以看到:

watson analytics

您可以看到下方的红框内,系统自动分析出一些分析结果供用户参考。比如按年度分析不同种类工时的发展趋势,按年份、工作状态的分析劳工小孩的个数、年龄范围的决定因素等等。这些业务问题在您提问之前就已经由Watson Analytics准备好并放在您眼前了。

您可以通过点击您关心的业务问题,以全屏方式展现分析结果。例如我们点击第二个业务主题“按年和雇员的雇佣状态分析小孩的个数”。如下图所示。

watson analytics

上图红色方框内的条件都是可以修改的,便于分析人员根据自己的分析思路探索问题的答案。从上图我们可以观察到无业人员拥有小孩的个数要多于在职人员。

现在,我们还可以对这个分析图形进行调整,比如我把统计日期限定在2012年,只需要将下方的数据里的Year字段对2012过滤即可。然后我们将雇员状态修改为年龄段(Age Range),则可以得到下图。

watson analytics

显然,我们发现,美国人在20岁之前及30~39之前的小孩子是最多的,特别是20岁之前。看来美国人还真是生小孩比较早。

同时,Watson Analytics还提供了自然语言输入对话框,以帮助您向数据提问。简单输入一个问题就会生成一系列分析图表供您选择。如下图所示,我首先单击图中的“+”号新建了一个数据探索页面,并在对话输入框内输入:How do the values of Children compare by Age?则可以得到下面的柱状图形。由下图可知,美国人在15、6岁时拥有的小孩数量最多,平均约有2个小孩。看来美国人早婚早育的情况比较常见。

watson analytics

为了便于业务人员更加灵活的进行数据探索,Watson Analytics除了提供推荐的可视化图形之外,还提供了多种可视化图形供用户选择,包括比较流行的气泡图、树图、标签云、决策树、刻度盘、热图、地图、网络图、螺旋图等等。

watson analytics

并且对每种可视化图形,系统也提供了更为精细的图形选项供用户定制。

watson analytics

待分析页面设计完成后,单击页面右上角的分享图标,就可以通过下图中的几种方式将分析页面共享给其它同伴了。您可以通过电子邮件、下载、Tweet、链接等方式进行结果的分享。

watson analytics

您也可以将您的分析页面保存到云端,以备下次分析察看使用。

watson analytics

看过我们上期文章的朋友,一定记得如何对数据进行优化。其实我们在这个新版本里,在数据探索的同一页面内,也可以进行数据优化操作了。如下图所示。

watson analytics

结束语

心动不如行动!感兴趣的朋友可以体验一下Watson Analytics的魅力吧。

版权声明:本文为博主原创文章,未经博主允许不得转载。

如何使用Watson Analytics获取更优质的数据

本期主要讲解如何使用Watson Analytics获取更优质的数据,以及介绍Watson Analytics的具体功能。...

有图有故事 - Watson Analytics 解析幸福指数

Watson Analytics是IBM基于Watson认知技术构建的一个创新云分析平台,它为用户提供了一系列自助式的分析服务,包括数据准备、数据探索、预测、构建分析仪表盘等。...

利用Google Analytics Api 获取数据——Google-api-python-client配置问题(一)

1、一直找不到在Google Analytics和Google APIs中新建的服务账号之间的关系,困扰好久,原因是没详细阅读API,如下记录: 第一步:在Google APIs中,如下,先创建服务账...

利用Google Analytics Api 获取数据——Google-api-python-client配置问题(二)

上一章节是在研究代码的基础上遇到的问题,本章节所述问题皆为应用实践中的困惑。 1、在抓取数据的小程序push到heroku的云服务器上后,运行后能print结果,但是写不到指定的文件中,由于程序在本地...

Watson Explorer 入门(3):创建搜寻器(crawler,数据爬虫)

(许野平的 Watson Explorer 笔记)创建集合后,可以看到如下界面:我们可以看到三个面板:1-搜寻与导入;2-解析和索引;3-搜索和内容分析。本练习讨论搜寻器的创建和配置,以及如何导入数据...

Watson Explorer 入门(1):非结构化数据相关概念

IBM Watson Explorer 是 IBM 认知技术最核心的一款产品。认知技术的核心是非结构化数据的处理能力。所以先来讨论一下非结构化数据的相关概念。结构化、半结构化、非结构化数据在我们和计算...

使用 Google Analytics 对 iPhone/iPad 应用进行统计和分析

Google Analytics 移动应用 SDK Google Analytics 除了进行传统的网页统计之外,现在也支持对移动应用的统计和分析了, Google Analytics 发布的针...

IBM与宝马合作,利用Watson研发个性化驾驶系统

IBM近日宣布与宝马集团合作,双方将共同探索Watson认知计算在个性化驾驶体验上的角色,并为未来的汽车创造更加直观的驾驶员支持系统。...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:如何利用Watson Analytics进行数据探索
举报原因:
原因补充:

(最多只允许输入30个字)