数据可视化
文章平均质量分 73
刚是程序员
https://www.linkedin.com/in/taogang/
展开
-
用可视化来讲故事
在科学松鼠会的网站上有一篇漫画,来自imgur.com,讲述了 科学理论是如何建立的我用到d3.js把这个静态的图改成了动态效果,代码可见githubSee the Pen Occam's Razor cn by gangtao (@gangtao) onCodePen.注:这个其实主要就是奥卡姆剃刀原理,“若无必要,勿增实体”。附原图 :原创 2017-06-30 09:57:50 · 541 阅读 · 1 评论 -
在ipython notebook中调用ggplot的三种不同的方法
在大数据时代,数据可视化是一个非常热门的话题。各个BI的厂商无不在数据可视化领域里投入大量的精力。Tableau凭借其强大的数据可视化的功能成为硅谷炙手可热的上市公司。Tableau的数据可视化的产品,其理论基础其实是《The Grammar of Graphic》,该书提出了对信息可视化的图表的语法抽象体系,数据的探索和分析可以由图像的语法来驱动,而非有固定的图表类型来驱动,使得数据的探索过程变原创 2017-06-30 09:37:03 · 999 阅读 · 0 评论 -
使用开源Echarts为Splunk打造类似语法驱动的分析可视化
Splunk是业内领先的机器数据平台,有非常易用的用户界面的可视化的选项。Splunk的可视化图表是使用开源的highcharts构建的。但是Splunk内置的可视化选项不够灵活,不能动态的进行数据到图表的绑定。可喜的是,最新版本的Splunk提供了客户自定义图表的功能, 利用该功能,我们可以打造一个类似Tableau或者ggplot的语法驱动的可视化工具。代码在github ht原创 2017-06-29 10:50:30 · 1599 阅读 · 0 评论 -
开源中国用户分析
加入开源中国也有超过三年的时间了,觉得开源中国已经越办越好了,突然很想知道它究竟有多好,我是不是开源中国最老的用户,我有176个开源中国的积分能够排名第几,带着这些问题,我抓取了部分开源中国的用户信息,做了一个简单的分析。数据获取要获得用户数据,可以通过开源中国的网页来进行。这个是我的主页面这个页面包含了用户的基本信息,包括用户名,积分,粉丝,关注等等。点击粉丝链接可以获得所有原创 2017-06-29 10:51:20 · 360 阅读 · 0 评论 -
数据可视化中的视觉属性
Stephan Few 是数据可视化领域里面数一数二的专家,他的几本书《Show Me The Numbers》,《Information Dashboard Design》和《Now You See It》都是非常优秀的关于数据可视化的书。Stephan Few 和 Tableau 的合作非常紧密,在 Tableau 的数据可视化的设计中,处处可见 Stephan Few 的思想原创 2017-06-30 09:57:01 · 1538 阅读 · 0 评论 -
使用开源软件快速搭建数据分析平台
最近,国内涌现出了不少数据分析平台产品,例如魔镜和数据观。这些产品的目标应该都是self service的BI,利用可视化提供数据探索的功能,并且加入机器学习和预测的功能。它们对标的产品应该是Tableau或者SAP Lumira。因为笔者曾经为Lumira开发数据可视化的功能,对这一块很感兴趣,于是就试用了一下这些产品,感觉这些产品似乎还有很大的差距,于是就想自己用开源软件搭一个简单的数据分原创 2017-06-29 10:34:33 · 4278 阅读 · 2 评论 -
图解机器学习
警告:多图杀猫!每当提到机器学习,大家总是被其中的各种各样的算法和方法搞晕,觉得无从下手。确实,机器学习的各种套路确实不少,但是如果掌握了正确的路径和方法,其实还是有迹可循的,这里我推荐SAS的Li Hui的这篇博客,讲述了如何选择机器学习的各种方法。另外,Scikit-learn 也提供了一幅清晰的路线图给大家选择:其实机器学习的基本算法都很简单,下面我们就利用二维数据和交互原创 2017-09-28 17:01:57 · 1866 阅读 · 0 评论