你知道数据科学家常用的利器有哪些吗?

原创 2016年08月31日 11:55:46

工具/产品/解决方案是数据科学家洞察数据的利器。KDNuggets网站对此观点进行了年度调查,来分析数据科学家在用哪些类型的工具。下面大圣众包小编整理了对大数据从业的你可能会有些帮助的工具!

数据科学常用的工具有哪些?

大数据生态(Hadoop、Spark)和开源项目:

Hadoop,HBase,Hive,Mahout,MLlib,OtherHadoop/HDFSbasedtools,Pig,Scala,Spark,SQLonHadooptools

微软数据科学家工具:

MicrosoftAzureML,MicrosoftPowerBI,MicrosoftSQLServer,RevolutionAnalytics

基于Python的机器学习:

Dataiku,H2O(0xdata),Python,scikit-learn,Theano,Vowpal Wabbit

SAS公司产品:

JMP,SAS Base,SAS Enterprise Miner

MATLAB、R语言等统计工具:

GnuOctave,MATLAB,Orange,R,Rapid Miner,Rattle,Weka

IBM公司产品:

IBM Cognos,IBM SPSSModeler,IBM SPSSStatistics,IBM WatsonAnalytics

Linux工具和SQLang:

Actian,C/C++,Perl,SQLang,Unixshell/awk/gawk

深度学习:

Caffe,Pylearn2

商务智能软件:

PentahoandQlikView

数据分析平台:

Datameer and Zementis

Excel和Word统计工具:

XLSTAT for Excel

其它:

OtherDeep Learningtools,Other free analytics/data mining tools,Other Hadoop/HDF based tools,Other paid analytics/datamining/datascience software,Other programming languages

数据可视化:

C4.5/C5.0/See5,Miner3D,OracleDataMiner

    数据科学家在选择大数据、数据挖掘和数据分析工具时,更倾向于有一定生态基础的工具,这样各个工具间可以相互支持。

    为了提高在大数据项目中成功的机会,选择正确的工具是非常重要的。没有一个孤立的工具能够做所有的数据分析,职业的数据专家趋向于使用不止一种相关的工具(分析中发现,数据专家平均使用5种数据分析工具)。你可以根据使用相关工具的数据专家来决定自己的选择。

    另外一个观点是,要选择大厂的产品,比如,IBM、微软和SAS,大品牌的产品更丰富,可以使得你的产品更容易扩展。


21个数据科学家面试必须知道的问题和答案

21个数据科学家面试必须知道的问题和答案转载请注明! KDnuggets 编辑提供了用以斟辨“假”数据科学家之二十问的答案,包括什么是正则化(regularization),我们喜爱的数据科学家,模...
  • Er8cJiang
  • Er8cJiang
  • 2016年03月31日 16:11
  • 3033

当今世界最NB的25位大数据科学家

在大数据技术飞速发展的今天,谁才是我们大数据科研与工业界中最有威望的科学家呢?下面我们来进行梳理,共罗列了25位当今世界,无论是在学术与工业界都产生巨大影响的数据科学家(Data Scientists...
  • heyongluoyao8
  • heyongluoyao8
  • 2015年09月20日 16:57
  • 24442

中国数据科学家年薪有多少?

近日,数据科学社群Kaggle发布了数据科学/机器学习业界现状调查报告。这份调查问卷的受访者囊括了全球50多个国家的16,000多位从业者,根据他们的问卷结果,大讲台老师带大家看看中国数据科学家的现状...
  • away30
  • away30
  • 2017年11月02日 14:47
  • 200

SparkR:数据科学家的新利器

from:http://www.csdn.net/article/2015-10-23/2826010 摘要:R是数据科学家中最流行的编程语言和环境之一,在Spark中加入对R的支持是社区中...
  • Real_Myth
  • Real_Myth
  • 2015年10月23日 11:38
  • 663

SparkR:数据科学家的新利器

摘要:R是数据科学家中最流行的编程语言和环境之一,在Spark中加入对R的支持是社区中较受关注的话题。作为增强Spark对数据科学家群体吸引力的最新举措,最近发布的Spark 1.4版本在现有的Sca...
  • cqboy1991
  • cqboy1991
  • 2016年01月18日 20:21
  • 491

SparkR:数据科学家的新利器

摘要:R是数据科学家中最流行的编程语言和环境之一,在Spark中加入对R的支持是社区中较受关注的话题。作为增强Spark对数据科学家群体吸引力的最新举措,最近发布的Spark 1.4版本在现有的Sca...
  • chennade1
  • chennade1
  • 2016年10月12日 14:09
  • 228

如何成为一名数据科学家

在回答这个问题之前,希望你先想想另外一个问题:为什么要成为数据科学家?当然,如果你是为了10万美元的年薪也无可厚非,但是我衷心希望你能将这个职业和自己的价值感挂钩。因为成为数据科学家的路途会很辛苦,但...
  • qq_40027052
  • qq_40027052
  • 2017年11月17日 10:51
  • 3540

如何区分数据科学家,数据工程师与数据分析师

http://toutiao.com/i6298464540338160130/ 如何区分数据科学家,数据工程师与数据分析师 2016-06-21 10:11 与其他一些相关工程...
  • liuyukuan
  • liuyukuan
  • 2016年06月23日 09:28
  • 1649

关于数据科学家,我们应该知道的这些事

几年前,Harvard Business Review 赞扬数据科学家是“ 21 世纪最性感的职位”。但是你知道成为一个数据科学家意味着什么吗?让我们首先看看数据科学家和专家们的一些著名的观点吧。 ...
  • qiezikuaichuan
  • qiezikuaichuan
  • 2016年09月26日 16:04
  • 110

如何成为一名数据科学家?

在数据分析、挖掘方面,有哪些好书值得推荐? 赞同1094 反对,不会显示你的姓名 肖智博,在读博士,做个几个项目 收起 幽谷尽头、xx hou、wei sun...
  • finethere
  • finethere
  • 2014年06月14日 16:30
  • 1044
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:你知道数据科学家常用的利器有哪些吗?
举报原因:
原因补充:

(最多只允许输入30个字)