- 博客(1)
- 收藏
- 关注
转载 Spark与Pandas中DataFrame的详细对比
PandasSpark工作方式单机single machine tool,没有并行机制parallelism不支持Hadoop,处理大量数据有瓶颈分布式并行计算框架,内建并行机制parallelism,所有的数据和操作自动并行分布在各个集群结点上。以处理in-memory数据的方式处理distributed数据。支持Hadoop,能处理大量数据延迟机制not lazy-evaluatedlazy...
2018-03-14 17:10:18 607
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人