数据分析包的比较:R,Matlab,SciPy,Excel,SAS,SPSS,Stata
(2010-11-02 12:35:29)数据分析包的比较:R,Matlab,SciPy,Excel,SAS,SPSS,Stata
名称 | 优点 | 缺点 | 是否开源 | 典型用户 |
R | 代码库支持,可视化 | 深入的学习曲线 | 是 | 金融,统计 |
Matlab | 优秀的矩阵计算,可视化 | 费用贵,不完全支持统计 | 否 | 工程 |
SciPy | Python | 不成熟 | 是 | 工程 |
Excel | 容易,可视化操作 | 大数据集 | 否 | 商业 |
SAS | 大数据集 | 贵,过时的编程语言 | 否 | 商业,政府 |
Stata | 简单的统计分析 | 否 | 科学 | |
SPSS | 和Stata很像,但是更加贵,而且差 |
1从表上可以看出主要是两大阵营:更加面向编程的解决方案,R,matlab和python;面向分析的解决方案,Excel,SAS,Stata和SPSS。
2python“不成熟”:matplotlib,numpy和scipy都是独立的代码包,它们往往不在一起。
3matlab语言是很弱的语言
4matlab是最好的开发新的数学算法的工具,在机器学习方面非常流行。
5SPSS和Stata是一个类型的
6SPSS和Stata主要适合科学计算
7SAS主要是一些比较早的从事数据相关工作的群体使用
8R的内存限制可以通过mysql来处理,或者运用机器集群来运算处理
9SAS在处理图形方面的能力有限
10R具有很强的可视化能力
11Excel 拥有庞大的用户群