淘宝数据产品部总监赵昆:数据可视化--挖掘数据背后模式与关联

2010年12月9日,年度收官技术盛宴SD2.0大会在上海光大会展中心国际大酒店隆重开幕。这是自2007年成功举办首届以来,由CSDN和《程序员》杂志主办的连续第四届SD2.0(软件开发2.0)大会。来自IBM、微软、盛大、FaceBook、阿里巴巴等众多企业的技术领袖全部汇聚,共同剖析当前IT技术发展大势,分享在各自领域的技术成就与成功秘诀。

淘宝技术研发部-数据产品部总监赵昆,在大会现场做题为《淘宝数据可视化》的主题演讲。

淘宝技术研发部-数据产品部总监赵昆做大会演讲

以下是演讲实录:

赵昆:大家好,我叫赵昆,我在淘宝的花名叫昆无。很高兴我给大家做这样一个分享,因为今天这个时间是1:30,我觉得是一个很困难的时间,因为很多人在这个时间比较困,特别是大家刚刚吃饱了饭,基于这么一种现状,给大家提供一个招数,我曾经用过的一个招数,如果他们觉得听我讲的很枯燥,很没有意思,或者想睡觉,可以向我一样,假装拿出一个手机,接一个电话,到会场外面透一口气,这样可以给我留一点面子,我也少一点压力,也很希望,我这次分享不会让大家出现这种局面。

我们回到整体,就是淘宝数据可视化,什么叫做淘宝数据可视化?看到这个主题我相信大多数朋友都觉得不知道是什么东西,包括淘宝为什么要做可视化?这个可视化包含什么东西,在场很多人可能不太了解,我相信在我们这一次分享以后,我相信大家对可视化会有一些新的认识。

在我们开始全部内容之前,我给大家看一个东西,这是一张图,我想请在座的猜一下这是个什么东西?有没有人愿意去尝试一下,可以大胆的猜测一下。

听众:是淘宝的链接是吗?

赵昆:淘宝的链接应该比这有更多的东西,还有朋友猜测一下吗?

听众:旺旺的。

赵昆:这个东西没有那么复杂,其实这个东西是一个很简单的,就是淘宝的类目数,淘宝有一个很庞大的商品体系,现在差不多有九千个类目,这个商品体系是整个淘宝商业很重要的基础,也是我们数据很重要的基础,因为所有关于的,不管是交易,还是各种各样的淘宝电子商务的各种流程,都是围绕这个类目数,这个商品体系去展开的,这是一个真实的数据,淘宝买书也挺火的,书籍分类很多,也非常系统化。为什么给大家看这个图呢?让大家从感官上了解一下什么叫可视化,通过类似的方式就让我们可以清晰对淘宝的商品体系有一个直观的初步了解,你知道这个之后,怎么做还有一个过程,这个先给大家说,感受一下什么叫数据可视化。这么一个东西,我这张截图是一个应用,可以缩放,拉伸,放大,各种各样的操作,你很清晰的能够看到,从这么一个应用里头能够看到淘宝的整个商品体系。

前面大家有感性的认识,接下来这里列了几个大纲,我又强调了一个新浪微博的一个例子,为什么这么强调呢?我个人还是蛮喜欢微博这个东西,因为有个很好的方式,可以跟更多的在淘宝之外的朋友能够进行更多的在线交流,因为不管是技术,还是什么,我们不能在自己的世界里头,需要跟更广泛的人交流,我们才能够走的更深。

我这次主要分成这六个方面:

第一个是会把数据可视化,什么叫数据可视化给大家由浅入深的讲一讲,第二个给大家看一下淘宝的数据,在就是淘宝数据可视化的案例,给大家看一下我们在数据可视化上面已经做了一些什么样的事情,这个东西不是一个概念,它真正是影响到我们的工作,影响到整个淘宝,我是想演示一下这个程序,一会儿可以看一下,因为分辨率的缘故,不知道大家是不是能够看到清楚,如果有时间尽量把我们的程序给大家演示一下,然后再讲一下淘宝的数据产品,它也是数据可视化的方式,最后淘宝在海量处理上面的东西跟大家分享一下,更多怎么样把海量的数据,这种价值能够去把它通过产品化的形式,能够让用户快速的得到,可能重点在这个方面。

说到这个数据,数据我觉得是未来很重要的方向,我相信今天在座的很多都是开发者,我们会看到很多应用,我记得昨天下午的时候听那个沙龙,刘江老师也说,基于海量数据的应用是未来很有意义的一个研究方向,其实我也希望今天通过我们的分享之后有更多的开发者能够参与到这个过程中,而且数据它其实也不是很空泛的东西。如果大家还认为淘宝是一家电子商务公司的话,我觉得大家肯定是落后了,淘宝是一家真正的数据公司,至少在迈入数据公司的路上,因为淘宝目前不仅仅满足于怎么样提供更大的电子商务的平台,更多是需要能够把这个平台产生的数据更好的生成一个更大的产业链,然后服务于更多的卖家买家。在今天我会给大家看一下淘宝在数据上取得了哪些成果。这是我分享的一个目标,分享的目标是说,让大家至少体会到这四个点。

第一个什么是数据可视化?再一个我们为什么做数据科学家?还有一个淘宝为什么做数据可视化?还有数据可视化的应用和未来。从事这几个方面通过我的分享大家能够有所收获。

我先抛一下理念,就是数据可视化中间的理念。首先数据可视化是国外的一个概念,数据可视化翻译过来的一个英文,还有一个对应的信息图形化,这两个是非常紧密的,通常在很多时候会用来,有相似的用途,一会儿我讲一下两者之间有什么样的关联。

还有数据可视化到底要做什么?就是挖掘在数据背后的模式和数据之间的关联。这个数据之间的关联真的很多了,比方说,如果你自己有一个网站,你的流量很大,比如你网站这个流量到底跟你最后,比方你的某个产品的转换率,到底有什么关系?其实这就是一种联系,但是它数据本身是没有直接联系的,我们怎么样通过可视化的手段能够把这个关系建立起来。还有数据可视化它包含三个大的领域,缺一不可,如果大家要致力于做数据可视化化的工作,至少在三个方面,在设计,研发,还有数据分析,这三个方面都要有比较深的积累。第四点所想既所见,这是自己总结出来的,我还在前面加一点,就是所想既所德,所想既所见,所见既所得,比如我们想要一个什么东西,我们可能希望得到它,通常直接得到不了,我们就先看到它,你看到的东西是你想到的东西,你最后得到的东西就是看到后得到的。第五数据可视化和数据挖掘,这两个之间到底有什么关系,这个我也会简单讲一讲,它们中间确实有一些关联的,我首先把这个数据可视化,数据挖掘讲一讲。

大家可能对数据挖掘很清楚,为什么还有一个数据可视化呢?我把数据挖掘的概念讲讲,数据挖掘通常面对一个特定的主题,通过建模,然后给结论,很重要的是数据操作者必须是数据分析师,数据可视化在这一点上完全不一样了,其实有些数据挖掘知识还是运用到,最重要让普通的用户自己去分析,数据可视化的使用者一定是普通的用户,不是专业的人员,比方说如果你的公司数据量很大,你可能想通过可视化的方式把一些东西提取出来,一些有价值的东西,用户可能直接是你的老板,或者公司的市场人员,他们可以很轻松的使用这些数据,我们传统可能通过数据分析师去做一些很枯燥的报表才可以。还有使用者自己去创造,你通过这些东西自己能创造出新的东西出来,这就是一个很重要的目标。关于数据挖掘和数据可视化它的区别,我这里简单讲一下,如果大家会后还有一些,觉得还有一些疑问的地方会后可以跟我一起来讨论,我非常有欢迎有更多的人进行交流。

我们这是一个正题,数据可视化跟信息图形化它们又是一个什么样的东西?这两个并不是严格两个相同的概念,或者相反的概念,不是,狭义的数据可视化,通过直观的方式将数据之间的关联能够展示出来,这个信息图形化通常把一些信息用图形化的方式去表达出来,我给大家举两个例子。这就是两个数据可视化比较典型的应用,这个是美国人口密度的分布,它通过大量的数据之后生成这么一张图,可以看到纽约附近人口很高,我们通过这么一个图很清晰的能看到分布,它基于大量海量的数据展示出来的。这个实际上是几支股票它的走势,因为股票这个也是非常细,我们想很快速方便的掌握几支股票它在很多年过程中的变化情况,可以用类似的方式去做一些展现,这个前提都是基于比较海量的数据。

这个是所谓的信息图形化,这个大家能够在网上看到了,微博上流传着很多类似的图片,这个在业界,主要在IT行业,大公司之间互相控诉的关系,我们经常听到苹果要告诺基亚,谷歌要告谁,互相告来告去,非常多,它们到底什么关系,这张图就清晰的表达出来了,这就是数据可视化的应用。

信息图形化其实也是属于数据可视化的一个方面,只是我这个地方稍微给大家区分了一下,它有两种区别相对比较大的表现方式,最重要的是数据不同,一种是大量的数据,一种是复杂的信息。这个是布什他在任期之内的演讲,哪个杂志里面的,布什任期之内演讲词当中提到,或者关于这个主题的演讲次数,我们可以看到这是伊拉克,阿富汗,大家知道布什刚开始一上任就发生了阿富汗战争,后面就越来越少。在经济上的一些东西,他在后面的这个阶段关注的多一点,前面不太关注,很简单,或者一句话,或者怎么样表达的东西,用一种很直观的方式,大家能够看到这里面存在的一些关系。这个是我在国外一个网站找的一张图,我非常喜欢喜欢这一张图,这张图非常深刻表达了数据可视化精髓的东西,这个图首先我们看它包含了,数据可视化前面我也提到了,它有三个很重要的领域,一个交杂的东西,一个是设计,蓝色的,左下角是信息,右下角是沟通,三个很重要的领域,可以同时在三个领域都有比较深的理解,我们才能做出比较好的可视化的一些应用出来。这个图还是比较复杂的,我讲一下。

首先所有这几个,外面这个大圆和中间这三个小圆,最后就是核心要表达这个数据可视化的一种应用,到底数据可视化包含什么样的东西,我们可以看。首先这三个圆到底什么东西?左边就是数据,右下角就是IDR,最上面就是外观和感觉,我们要很好的做数据可视化,要具备这三个方面,首先有数据才行,然后你得有想法,你得有创意,你同时必须要有这种表达的能力,通过外观,或者你感觉的表达,这个可能还有点抽象,我们再看,更确切一步就是这三个东西,左下角是数据集,数据只是一个概念,这就是一个实体的东西了,然后右下角要有目标,有了想法之后,我们最终要有比较具体的目标,我们最重要达到什么目的,上面就是可视化的设计,比如设计师能够把最终设计的东西出来,这三个很具体的东西,通过它能够汇总出数据可视化的应用。

这个就是输出,这里可以看到这几块是输出,最终它会输出一些什么东西,会有一些仪表盘,还有数据分析,报表,还有一些故事,还有一些界面,我们最终输出的就是这些东西,输出的这些东西只是一些表面上的东西,我们希望能够达到几个目标,一个它有相关性,还有非常简化,不是说很复杂的,看也看不懂,再有信息传导性,明确的能够把信息表达出来。这个图还是很有逻辑关系的,它之间数据集跟一些设计,它交杂的,通过设计的想法,能够尽可能把这个东西简化,还有信息,把这个目标,数据,能够明确把这个信息表达出来。

最终我们得到了什么东西?我们做数据可视化得到了什么东西?因为这是国外翻译的一个词,不太好理解,这是形态,还有知识,还有概念,最重要要得到这三种东西,我觉得这一张图片包含了数据可视化,很多比较精髓的东西都已经包含进去了。这张图包含的逻辑关系是很紧密的。

再讲一下我们数据可视化也是一个目标,也就是我们为什么要做数据可视化,通常我们的理解来看,数据总是很枯燥的,很难懂的,还有一个数据爆炸,现在数据不是太少了,是太多了,我根本不知道什么样的东西对我是有意义的,这种时候我们就会忽略这种数据,其实最后我们错过很多有价值的信息,还有不同数据有什么关联,有什么关系,还有大量数据背后到底隐藏什么样的东西,这是我们为什么做数据可视化的一些目标。

我们前面初步把数据可视化的概念和理念跟大家讲了一下,大家从感性到理性上对这个数据可视化应该有了一个初步的认识。接下来我们从淘宝来讲讲可视化的应用,我们为什么要做数据可视化?还有淘宝本身数据到底是什么样的?

我先给大家简单讲淘宝数据的特点,很多公司都有自己的数据,特别比较大的公司也有很多很多海量的数据,但是淘宝数据有什么特点呢?首先它巨大的商业价值,它天然的,因为电子商务的数据天然为商业而生,为商业而死,天然具备商业兴,现在有几百万的卖家在淘宝上做生意,会产生大量的数据,这些数据本身帮助他们更好的在淘宝上做生意,或者能帮助更广泛的电子商务的从业者,因为这些都是实实在在的用户产生的交易。最后是付飞类型,现在互联网的公司形态有很多种,有做搜索的,有很多,但是淘宝数据的特点就是它的类型很丰富,我们不仅仅只是一些交易形式,如果从数据本身来说,一些非常海量的交易信息,还有商品,很庞大的商品信息,还有用户的这种信息,甚至还有很多搜索,因为淘宝即便单独做一个搜索引擎在国内也是排在前几位,每天有十多亿的搜索次数。第四个就是海量,每天产生大量的数据,现在新增20个T的数据,很早达到PB量的数,还有数据是真实的,不像一些统计网站包含很多想法的东西,它是非常真实的数据,还有一点它的实时采集,这个也是蛮重要的,这个对于互联网公司来说不算什么,对传统的行业来说这个实时采集确实有很大的区别,比方说大家在传统领域,比如一些数据公司,他们有很多很多年的数据咨询的经验,他们的数据,每年有很多大公司从他们这里购买数据,都是花几十万,几百万美金去购买这些数据,这些数据最多一个月才更新一次,即便是如此,还是有很多大公司非常需要这些数据,因为到了一定规模之后,你必须用数据才能够进行一些决策,如果数据更新周期这么长,必然导致你商业决策的落后。因为淘宝是一个电子商务,一个商务型的,电子商务领域,传统商务也是一个很大的领域,很多时候淘宝数据,比如说我们的一些竞争关系,不仅仅在线上,很多时候针对线下,这是2010年大体的一个数据,这是一个现状,我们现在在线商品数超过7亿,每分钟销售三万种商品,每天产生的PV超过20个亿,这个量是非常大的。这么大的量,其实我们都需要进行分析和处理。把淘宝的一个发展情况给大家看一下,淘宝07到2010年都是以百分之百的速度增长,今年预计达到四千个亿,四千个亿是什么概念呢?应该说能够达到整个中国零售总额,不是说在线,是整个中国,包括线上线下的零售总额,能够达到2%左右,这是非常非常大的一个数据。还有淘宝的注册会员也是非常高速的增长,现在不是2010年底,最后的数据还没有统计出来,每年以百分之七八十的速度增长。这么高速的增长必然引申用户膨胀的需求,如果我们是一个需要购物的东西,我们需要得到什么样的信息。如果我们是购物的人,我们肯定希望在浩如烟海的东西找到自己要的东西,一定有一个感觉,怎么快速找到我想要的东西,这个数据就可以帮到你,还有怎么样满足我个性化的需求,淘宝是公共的,是平等的,常年我在淘宝上购物已经形成了习惯,怎么样能够提供个性化的需求,还有我不会用电脑想在淘宝上购物怎么办,喜欢购物的人肯定很关心现在流行的一些东西。还有作为一个商家需要什么样的数据,希望得到什么样的信息,我应该卖什么,现在到底什么东西是最供不应求的,然后怎么样制定我的营销计划,还有我的商机在哪里?如果你是一个消费品的生产企业,你想进一步了解这个行业的趋势是什么,市场有多大,用户长的什么样子,包括产品的生命周期是怎么样的,我讲完之后大家觉得其实都是已经有用了,我们现在是不是已经做到了,我们现在已经推出了一些数据产品,很多已经满足了刚才提到的,通过数据已经能够满足这些用户的需求。

我再讲一下淘宝数据可视化,刚才把淘宝的数据的面貌给大家简单看了一下,再看一下我们在淘宝数据可视化的一些案例吧!因为今天时间也不是很多,我简单给大家过一下,这是我们在做的,针对数据可视化的一些应用,比方说针对买家的购物,根据他的购物历史,然后发现他的购物趋势,然后关联这个行业的购物分析,比如购买行业的一些买家,购买其它类型的哪些产品,还有按照属性挑商品。

还有城市购买力分布,不知道有多少人去过杭州,大家能举一下手吗?这么多,杭州真是一个很不错的旅游城市,这么多人去过,没有去过的人到底什么是杭州,这个就是杭州,这个就是杭州整体城市的一个买家分布,如果大家有兴趣可以跟大家分享一下。刚才是整个杭州,我们看一下市区,这是杭州市区的,更密集了,杭州西湖区,淘宝就座落在美丽的西湖区,还有很多这些地方,我们的买家在什么地方,我们通过可视化的手段都能够很清晰的掌握到,而且我们不仅分析了买家,还分析了卖家的分布,很多时候做数据可视化一个目标,尽可能把尽可能多的纬度在一个很简单的界面上展现出来,但是有一个特点,不告诉你这个是干什么的,这个数据可视化都很难理解,我前面给大家看到的,比方说美国人口分布一样,你可能猛一看告诉你什么不知道,告诉你你能很快速的知道是什么意思,我们会做一些实时的成交,因为这是一个实时,不同颜色代表不同的商品。

还有市场供求关系,为了找出市场空白的地方,大家知道淘宝上卖什么东西都有,你基本上能想到的东西都能买到,到底什么样的东西供不应求,这个信息对买家来说非常有意义的,到底什么东西已经供过于求的,如果我们知道我们不用再扑进去造成浪费。还有卖家投资收益分析,他可能不是经营一个商品,他可能经营很多商品,给他一个投资分益,投资收益的一个分布。大家看到刚才那些产品都很直观,跟我们以前看到的图片完全不一样,简单的告诉你这是一个什么意义之后,你就可以很轻松的掌握它的实用,还有我们会对淘宝所有用户的行为进行分析,把相同类型的用户进行分组,最后找出共同的行为特征出来,比方说上海市的年轻女性,她们一般是什么样的行为路径。

然后举一个DEMO,因为是在PPT里头,他通常购买类目商品的分析。这个是淘宝整个商品的内目商品体系,真正的商品体系,我们看从女装,一直到各级内目,一直到品牌,以及最后这个产品,面积越大实际上表示成交量越大,通过这个我们可以很快速对整个淘宝有完整的商品体系成交趋势能够有非常迅速的了解。

这个是一个季度的女装,女装有很多类目,重要的商品类目变化的趋势,我们可以看到冬天的来临羽绒服购买越来越多,因为时间关系,我快速的给大家浏览一遍。

这个是整个淘宝页面的关联关系,用户最常进入哪些页面,这可以点击,可以任意托动,旋转。

这是我们大的可视化的应用,大家就知道可视化大概是什么样的东西了。

再给大家讲两个很小的故事,我今天在会场发现很多很多用苹果平板电脑,这个时间轴大家应该能看得清楚,第一个很高,这个绿色线条是搜索次数,这个蓝色是浏览的次数,有没有人知道第一个曲线凸增是什么意思?

听众:发布会。

赵昆:真是苹果的粉丝,今年苹果正式发布了苹果平板电脑,那时候还没有产品,很多人在淘宝上搜索,苹果平板电脑到底有没有很多人去搜,最后没有搜到,曲线就掉下来了,发现没有苹果平板电脑买的,这个大家知道吗?4月3号,苹果平板电脑正式在美国发布了,有很多很多的人到淘宝上来搜索,其实那个时候已经可以在淘宝上预定了,这个是从1月份到四月份苹果平板电脑在淘宝的数据体现,为什么给大家看这个,实际上在商业上,很多跟我们生活相关的事件都跟淘宝的数据有非常紧密的关联,这种数据我们再进一步的扩展又会得出新的价值的信息,比方说这个,这个是从4月2号到4月18号,这也是苹果平板电脑的变化,蓝色线条是需求指数,绿色是供应指数,这个指数我们,比如需求指数,通过一个简单的公式把它简单计算出来,公用指数通过成交量,还有相关的东西把它计算出来的,我们就可以看到短短两个礼拜的时间发生了什么时间,4月3号苹果已经在美国正式发布了苹果平板电脑,这个曲线一直不停的往上升,到了4月12号之后开始往下掉了,有没有人猜出来这是为什么?这个需求指数开始往下掉了,有没有人大胆的猜测一下。猜不出来我说一下,就是因为那个时候很多该买的已经买了,买不起的他也买不起了,因为那个时候价格还是非常昂贵,结果一看这么贵,现在买不起就等等吧!发现这个需求指数往下掉了,看卖家供应指数一直往上升,卖家是感受不到,他感觉到很好卖,拼命的在苹果平板电脑投入。实际上在这个点的时候其实供需关系已经发生了转折,在这个时候已经出现了供过于求的局面,但是卖家还是不断的往上增,而且这有两个趋势线,我们看到4月10号的时候已经出现了一些迹象了,这个供需可能发生一些变化了,最终发生彻底的转折,这是我们在数据中看到的一些,可能我们通常看不到的一些东西。

这个下次再跟大家分享,这个就是纹胸,淘宝上卖纹胸很火的,30多岁可能在淘宝上很少买,中青年在淘宝上买纹胸非常多的,我们不要把这个理解数据可视化很眩的图表,其实就是把数据之间隐藏的东西用直观的形式表达出来就可以了,任何形式都可以,09年这个在中国是最多的,我知道中国的女性大概是什么情况,有一个比较大的区别,这是第二名,09年的时候是75A,到了2010年就已经变得80B了,这说明什么问题呢?大家可以去猜测一下。这个我们在这里不再细讨论了,我们可以从这些数据中看到很多很有意思的东西,有些人问为什么淘宝这个数据拿出来就能表达中国女性的一些变化呢?因为我前面提到了,首先淘宝在电子商务的份额非常非常大,大家也应该非常清楚,这个数据是绝对能够体现,至少在整个中国网民她购物的趋势,年轻的网民占绝大多数,像我妈妈这一辈就不用分析她了,这些年轻女性有什么趋势分析这个就已经可以看出来了。

这是其它的在淘宝上的数据,我们这么大的数据,我们要去处理它,最终被用户去使用,到底需要做哪些事情,通过这么一张图,看一下我们到底在哪些方面在做一些努力,每天数据不停的在增加,每天超过20个T的数据,我们海量数据存储做积累,每天我们扫描,我们不可能把所有的数据都翻出来看一看,每天会扫描500个T的数据,会对这500个T的数据进行分析处理,处理完了之后,但是这个数据还是很大,还需要做高性能查询的优化,最终给用户使用,通过产品,可视化的使用,能够让用户使用这些数据,这是我们在数据这一块做的一些事情。这个是我们的一个模型,大家如果感兴趣,我们的数据从原始数据,最终到给用户看的,到底经过了什么样的步骤。

这里有一个简单的数据量,前面提到超过十亿,我们现在差不多将近一万个类目,超过一百万的产品,产品是个什么概念呢?比如诺基亚是品牌,诺基亚N73就是一个产品,这都是我们需要分析的,大家做过数据的肯定比较敏感,这么大的数据交错的分析怎么样去做到,这也就是我们现在一直不断在做的一些事情,我们提供这样的一些架构,回头大家如果有时间,我们可以会后可以进一步讨论,今天我在这里不再给大家细说了,为了这种数据快速让客户得到我们需要做什么样的事情。这是基础架构的图。

这里讲一下数据魔方,它是淘宝第一个基于全量的产品,这个产品完全基于淘宝所有的数据出来的一个东西,它的底层按照基于云计算的,这么大的没有云计算不可能快速的计算出来,还有它是一个具有成熟的,基于海量数据的商业数据产品,在国内肯定可以这样说,而且它完全基于海量数据的商业数据产品,我特别强调商业,很多时候数据,今天我们大家谈数据到底有什么用,能产生什么价值,这就是一个价值,因为现在大家都知道淘宝现在已经实现了盈利,我们有一些盈利的方式,这个数据魔方它其实已经成为淘宝盈利新的一个增长点,现在已经为淘宝带来很可观的盈利,我们通过这个数据确实赚了很多钱。做商业产品其实会要求很高,因为用户付了钱,举个例子说,他付了钱对产品有更高的要求,希望对他有真正的帮助,未来很多人从事和数据相关的事情,这里给大家提供一个模板,数据真的是可以赚钱的。上午我们一个同事提到了,明年我们会把一些数据开放给第三方,我们不仅仅依赖自己的数据去做一些产品,我们会把我们的数据通过开放平台分享给更多的ARSB,大家参与更多的数据挖掘。

这里就是魔方的一个,数据魔方到底是一个什么样的东西?它的数据是什么样的?可以做到的就是,这里有十多个纬度,15个纬度,任意的交叉,得到最后的指标,成交,及人数,如果对数据比较敏感,应该能够意识到这些数据能产生什么样的价值,你可以知道任意时间点,什么样的行业,什么样的品牌,什么样年龄的人,什么样性别的人,比如上海市18到25岁的年轻女性,她们通常感兴趣的是什么样的东西?

这里有几张产品的截图,给大家浏览一遍。这里是我们接下来准备发布很重要的一个数据产品,叫淘宝指数,这个名字不太重要,关键给大家提供一个能快速,因为前面提到了,我们数据魔方是一个商业的收费产品,其实只有付费用户才能使用这些数据,我们明年准备开放针对所有对电子商务感兴趣的一个数据产品,淘宝指数是完全免费的,我们也希望通过这个产品能够改变中国人购物的习惯,这个会有人问为什么能改变,比如你现在去买一个东西,你可能好奇说,比如买一件衣服,上海市的年轻,或者华东地区的年轻女性,他们会感兴趣什么样的一些衣服,或者说他们目前正在做些什么,或者他们的价格走势是什么样的,比如想买一款手机价格怎么样,甚至还有更深的数据,都可以通过这么一个产品去获得,这是给大家预告一下,我们未来会做的一些事情,从这里我们可以看到,不仅仅只是说数据可视化,这是一种展现,只有要能够把海量的价值挖掘出来给大家使用,它的目的就达到了,这是我们做这些事情很重要的意义。

今天我的分享就到这个地方,谢谢大家。有什么问题?

提问:淘宝有一个淘宝服务,淘宝服务类似面对淘宝很多商铺的一些,我看到上面有第三方的开发者,只要商铺授权的话,我可以拿到商铺每日运营的数据,每天点击量多少,卖了多少,我看淘宝服务上不下两三家,或者第三方开发者在做这个东西,这是不是跟淘宝类似,刚才说的淘宝指数这样的产品,是和他们合作吗?

赵昆:会后你可以来找我,在此谢谢大家。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值