python包:Dask介绍

先上官方文档:Dask
搜索相关问题:Stack Overflow with the #dask tag

Anaconda默认安装了Dask,因此我们不需要再另外安装Dask。并且linux和window都可以使用。

介绍

Dask核心图片来源:https://docs.dask.org/en/latest/index.html

一句话总结: Dask is a flexible library for parallel computing in Python.

  1. 动态调度资源提供并行计算(加速)
  2. 并行化的数据集成提供接口给numpy,pandas或者python迭代器(提供接口)
  3. Task Graph 任务图非常清晰,使得开发人员和用户都可以自由地构建复杂的算法,并处理大多数数据工程框架中常见的map/filter/groupby范式难以处理的混乱情况。(帮助理解)
  4. 从个人电脑->集群(用途广泛)

简单的对比

Dask DataFrame mimics Pandas

import pandas as pd                     import dask.dataframe as dd
df = pd.read_csv(
  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值