熟悉Pandas的同学会知道,Pandas相当于Python中的Excel,都是基于二维表的进行数据处理分析,不同的是,Pandas基于代码操作数据,Excel是图形化的分析工具。
不少人会问Excel比Pandas更简单,为什么还要学习Pandas呢?
这就好像问window和linux和谁更好,确实很难一元化的去下结论。
从程序角度说,Pandas相比Excel的优势很明显,这里说是特点更合适,因为这两者使用场景不一样,没有太多可比性。
1、Pandas能对接Python所有的内置模块、第三方库,比如Tensorflow、Scikit-learn等,适用的场景更多。
Pandas是由于金融分析的需求被开发出来的,从一个单一的数据处理库,变成了链接Python数据科学生态的基础库。
所以从事Python数据科学,一定离不开Pandas。
2、Pandas能处理的数据量更大,几个G的数据都不成问题,而Excel最多能处理104万行。
Pands 可以和Spark、MongoDB、Dask、hadoop、flink等大数据工具进行交互,能轻松的处理TB级别的数据。