spss和python stata matlab_(SPSS,Matlab,stata,Python)相关性?

没用过Stata,其他几个都算是用过的。简单写下几个工具之间的关系,这些软件要说相关一般也是在数据处理上了,所以就主要在数据方面上讲下。

SPSS

先说优点,它算是我们统计专业必须掌握的一个软件了,因为很多(规模不太大的)数据都可以用它来处理。一来做一些常见的回归分析,聚类分析和因子分析都是很方便的。而且也能做一些比较复杂的东西,比如SVM和神经网络这些。对于不会Python和R等编程语言的人来说,SPSS是数据分析中必不可少的。一般使用都是按钮式的,当然也可以写脚本操作(不清楚写SPSS脚本的多不多)。

再说缺点,SPSS处理其数据比较大的数据会比较吃力。之前弃用它就是因为到了几百M的数据就很卡(也可能是因为电脑原因...)。另外就是重复处理数据不太方便。比如做EDA的时候,需要不断的拆分重组数据,在SPSS就需要保存成一个一个的数据子集,不然要一直点点点...(如果用R或者Python,只是一个变量就能解决的事)

此外,SPSS还有一个专门用于数据挖掘的版本:IBM SPSS Modeler。也由不少人在用,题主可以尝试用下。官网给的说明:SPSS Modeler provides predictive analytics to help you uncover

data patterns, gain predictive accuracy and improve decision making.

MATLAB

目前只是用MATLAB解一些方程或者推一些比较复杂的公式。之前在Linux是用Octave代替MATLAB用的。用它作了Andrew Ng的ML作业,感觉还可以,在矩阵运算上很是方便。另外知道的是在建模和仿真上,MATLAB是真的用的多(图像处理用MATLAB也比较方便,毕竟大部分也是矩阵运算)。

另外,Python中的Numpy库和MATLAB的语法很相似。MATLAB能做的矩阵运算,在Numpy中一般也可以做。

Python

用Python算是最多的了。因为作为一个工具,Python具有很多优点,入门较快,强大而完善的第三方库,这些都使得它成为我们做数据的首选了。Requests,Scrapy等库可以很方便地开发爬虫获取数据,Pandas库可以让我们自由地处理数据的格式,Matplotlib提供强大的可视化功能.以及用于数值和符号计算的Numpy和Scipy,用于机器学习的sklearn, tensorlfow等。

总结下,SPSS和STATA都算是统计软件,有软件固有的操作简单,用户友好等优点,当然也带来不灵活,性能欠佳等不足之处。MATLAB和Python作为编程语言,可以更加灵活地处理我们的需求,当然门槛会比使用软件要高一些,编程语言本身也是在一定领域优势比较大。至于相关性,软件能做到的,编程语言都能做到,只是方便不方便的问题...所以,做数值分析,仿真建模就用MATLAB;一般的数据分析就用SPSS,STATA;想更好地处理数据,分析和挖掘数据就用Python。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值