数据可视化,我应从何开启?

我喜欢数据并将它广为人知。

如果您最近和我参加聚会我在您耳边说的都是有关数据可视化工具或者最近使用的酷R包对此我在这向您表示歉意。

如果您和我玩范特西游戏欢迎您来到图表世界这里有很多的图表。

不要为越来越频繁地听到下面的问题感到惊讶“Nick我想走向数据分析和数据可视化我应该从哪里开始

不幸的是没有一个完美的答案适合所有的人–每一个人的需求不同且人们已经知道的东西相差很大。但令我高兴的是一件关于最近科技/教育/商业环境事情

来自不同职业道路和背景的聪明人都对自己说“我需要从数据中得到更多”。

但是在很多初学者沟通后发现了的共性。很明显这些共性不是适合每一个人的

一个老练的工程师会嘲笑共性上说的第一时间学习Java脚本或者Python。

早已知道D3.js 的人会疑惑选择哪一个可视化工具或者疑惑怎么样将数据驱动转换应用顶级的3D中

这些适合想进一步了解接近数据可视化的学术科学家、学校老师、研究咨询师、项目经理、失业快乐族或者MBA毕业生……。

如果符合你我认为你应该开始于从“无编码”有计划地学习到“爱编码”。

无编码

首先如果你对excel一无所知这是值得去做的。严肃地告诉你至少得学会透视表听起来有些差劲但是Excel能做很多超乎人们想象的事情。如果你善于尝试Excel甚至能做出很多漂亮的图表。

如果你已经有一些数据仅仅想用一个好的工具来探索可视化或者输出更多引人注目的图表。Tableau 就很流行、功能惊人它有免费的公共版和一个十分昂贵费用的付费版

不过如果你是学生就可以享受到免费版。它一般会在网上或者论文上以静态图表形式发布也可以传送到Instagram上或者以墙图输出。在它的官网上可以找到很多模板激发你的灵感。

遗憾地是将要探讨的另一个工具–Infoactive,可惜已经下架了但没关系Tableau吸收了Infoative所有优点。这个意味着Tableau很有可能是未来公认的好工具。我将牵头一本免费的书它是Infoactive团队带领下涉及数据可视化设计工具的背景资料下面谈论的任何工具:

数据+设计

一个简单有关准备和可视化信息的说明介绍

简单编码

如果要选择一款独立的程序语言来操作单机数据我会选择R语言。因为R语言是免费的且支持大量的在线开发加载有用的顶级基础语言程序包并且有大量的免费资源学习如何运用它。在这些资源中–我极力推荐Coursera课程

数据科学家证书|课程

约翰霍普金斯大学验证通过的数据科学专业化专家成为数据科学家自由谈论……

它们可能会抹杀一个真正的初学者但是课程能带你走出一条重要数据科学项目和想法的路线通过所有的方式探索数据分析它涵盖了有用的R包例如ggplot一个十分受欢迎的可视化工具的交互性通过Shiny和数据故事发布在网页上。

R是我最常用来处理小型快速的分析和数据可视化工具–如果有一个数据数据量大、不易于可视化Excel处理不了R最适合快速探索。

“是的你可能要学些一些SQL”另外一个快速入门的语言–SQL与R相比实际上这已经超出了苹果和苹果的比较SQL是一门比较有针对性的语言

如果你希望在数据库中用任何工具或者语言集成数据这将是一个很好的机会让你有学习SQL的兴趣。

爱编码

通常在网页上看到一个美好的交互式可视化界面都会浮现一个问题“我们要从何学起”。我着迷于这个创新的领域点击这可以看更多深入的调查)。

不幸地是如果你喜欢这些作品

一个机器学习的可视化介绍

让我们重新审视73英尺高的边界提出了我们的建议看看我们是怎样地提高直觉。明显地……

……它可以令你沮丧的发现还有多少东西需要自己学习。反复的实践以求得“《纽约时报》一样好”是一个艰难的目标值得但是困难。

幸运的是这里有很多帮助资源。

交互式的作品后面的逻辑库和很多在网页上运行的数据可视化作品都是Mike Bostock创作的D3.js。D3.js是一个很好的工具去学习作品网页发布和交互式。

博斯托克Bostock的网站是一个有关金矿的例子和教程网站你不需要筋疲力竭地从逻辑库的创建者学起……。

我也推荐Murry创建的网页版交互式数据可视化你可以从 O’Reilly 那购买或者网上在线免费使用:

网页交互式数据可视化

这是一个关于非程序员的编程数据可视化的书。如果你是一个拥有视觉技能的艺术家或图形设计师但没有从事数据或代码工作的先验经验这本书适合你。如果你是一个拥有大量数据的记者或研究人员但没有数据可视化或代码的先验工作这本书也适合你。

在线版本很好–你可以跟着书本本身编写代码脚本运行它并拿你的输出结果和模板比较。Murray 还特别为初学者量身定制这个网站能很好的引导初学者从HTML/CSS和Javascript基础到深入学习相对难的D3。

D3的地理空间可视化是一个值得一提的长处。D3擅长创造很多不同效果的地图,如果这是你的专业领域这里可以获得不错的专用教程

让我们画一个泡泡地图

我以前让地图教程介绍了如何用D3和topojson做一个基本的地图现在是时候让它覆盖……

D3很难操作但也有工具能降低难度我建议使用最基础的D3而不是复杂的绘图程序如果你人觉得棘手那使用Plot.ly会更实际。

如果你要学万能的程序语言那Python是最适合。它功能强大目的性强很受欢迎。

我发现Python是一种极易上手且多用途的编程语言。但实际上如果你要做的是探索和可视化数据它会让你觉得吃力:例如Youtube就是用Python开发的……代码有一百万行。如果你想了解PythonCode Academy 课程是一个短且有趣的语言介绍。

最后和前面介绍的D3.js Javascript or ggplot R一样, Python也有很多资料库。最值得推荐的是Seaborn(建立在一个年长受欢迎的库,matplotlib)和Bokeh很有可能是一流的但是这是一个快速发展和提升的领域。Seaborn and Bokeh 的网站包括画廊展示你用这些工具创建的各种各样的可视化作品。


本文作者佚名

来源51CTO

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
这是一个VB6的IDE插件(Addin),使用VB6的IDE直接设计Python的界面。 Python和VB都是能让人快乐的编程语言,我使用了Python之后,很多自己使用的工具都使用Python开发或改写了,因为最终实现的Python代码实在太短了(相比VB),有时候Python一行代码就可以实现VB一个函数的功能。 Python就是这种让人越用越开心的语言。 不过说实在,使用Python开发GUI界面还是麻烦了一些了,自带的标准库Tkinter使用起来非常简单,不过对于习惯了VB拖放控件完成界面设计的同学来说,还是不够人性化。TK也有一个工具叫GUI Builder,不过它使用Layout布局,不够直观,而且界面简陋,用起来也不爽。 至于PyQt/wxPython等GUI库,尽管有可视化设计工具,但总感觉做一般的轻量级应用是杀鸡用牛刀,学习起来也比较复杂,而且不够环保,不够低碳,要带一个很大的库,需要目标机器上夜同样安装了PyQt/wxPython,做不了绿色软件。 所以最终的结果是我更喜欢Tkinter,用起来很简单,绿色环保,真正的跨平台,一个py文件到处运行(担心泄密就编译成pyc)。 很多人都认为TK的界面不够美观,不过导入Python自带的标准TTK主题库,界面非常Native,不输PyQt/wxPython。 此Addin默认启用TTK支持,也可选择关闭。 总而言之,轻量级GUI,TK+TTK足够。 使用此Addin,你可以不用写一句代码就可以生成一个完整可运行的Python的GUI界面,支持python 2.X和3.X。 安装方法:将压缩包解压到你希望的目录,然后执行Setup.exe完成注册插件过程,打开VB6就可以用了。 在VB窗体上设计完成界面后(你可以大胆的设置各控件的属性,Addin尽量将其翻译为tkinter的控件属性),点工具栏上的VisualTkinter(图标为一片橙红色羽毛),再点'生成代码'按钮,即可生成可运行的Python代码,可以拷贝至剪贴板或保存至文件。 一般情况下你可以不用再改变tkinter的控件属性,但是如果你熟悉tkinter,需要更多的控制,可以一一核对各属性,并且修改,再生成代码。 除了用来设计界面外,此ADDIN内置的各控件属性列表可以做为编程参考,比较完整,除了极少数我认为大多数人都不用的属性外,属性定义基本上是我从官方的tkinter文档直接翻译的。 如果还没有VB6,网上找一个VB6精简版即可(建议使用12M的版本,6M的版本也可以使用,不过工具栏图标无法显示,可以通过菜单执行此插件)。 经过网友测试,完美支持WinXP,Windows 7, Windows 8。
### 回答1: 可以,您可以使用Python中的Pandas库来读取和操作Excel文件的数据。以下是一个基本的示例代码: ```python import pandas as pd # 读取Excel文件 df = pd.read_excel('example.xlsx') # 打印数据 print(df.head()) ``` 您需要将代码中的"example.xlsx"替换成您想要读取数据的Excel文件路径。然后,您可以使用Pandas库提供的各种方法来操作和处理数据。 ### 回答2: 当然可以!Excel文件是一种常见的电子表格文件格式,它可以包含各种各样的数据,包括文本、数字、日期等。要识别Excel文件中的数据,你可以使用各种不同的方法: 1. 打开Excel文件并手动查看数据:你可以双击Excel文件,用Microsoft Excel或其他类似的软件打开它,然后手动浏览数据。 2. 使用编程语言处理Excel文件:如果你具备编程知识,可以使用Python、Java、C#等编程语言中的库或模块来读取和处理Excel文件,例如Pandas、Apache POI等。 3. 使用在线工具处理Excel文件:互联网上有许多在线工具可以帮助你识别和处理Excel文件,例如Google Sheets、Zamzar、Smallpdf等,你可以上传你的Excel文件并进行数据处理。 4. 使用数据分析软件处理Excel文件:如果你需要对Excel文件进行更复杂的数据分析,你可以使用一些专业的数据分析软件,如Microsoft Power BI、Tableau等,它们具有较强大的数据处理和可视化功能。 总而言之,无论是手动查看,还是使用编程语言、在线工具或数据分析软件,都可以帮助你识别Excel文件中的数据。具体选择何种方法,取决于你的需求和技术水平。 ### 回答3: 可以。Excel文件是一种电子表格文件格式,其中包含了一系列的数据和公式。可以使用各种编程语言或软件工具来识别和处理Excel文件的数据。 一种常用的方法是使用Python编程语言中的pandas库来读取和解析Excel文件。通过pandas的read_excel函数,可以将Excel文件加载到一个DataFrame数据结构中,然后可以方便地对数据进行处理和分析。 另外,还可以使用微软的Excel软件自身提供的功能来识别Excel文件的数据。在Excel中,可以使用公式、宏以及数据分析工具来处理和分析Excel文件中的数据。 总之,只要使用适当的编程语言或软件工具,就可以轻松地识别并处理Excel文件中的数据。无论是进行数据分析、数据清洗还是数据可视化,都可以通过读取和解析Excel文件来获取所需的数据。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值