RAPIDS

RAPIDS数据科学框架包括一系列库,用于完全在GPU中执行端到端数据科学管道。 它旨在为使用Python工作的数据科学家提供熟悉的外观和感觉。 这是一个代码片段,我们在其中读取CSV文件并输出一些描述性统计信息。

import cudf
gdf = cudf.read_csv(‘path/to/file.csv’)
for column in gdf.columns:
    print(column.mean())

RAPIDS使用优化的NVIDIA®CUDA®原语和高带宽GPU内存来加速数据准备和机器学习。 RAPIDS的目标不仅是加速典型数据科学工作流程的各个部分,还要加速完整的端到端工作流程。

我们建议您查看我们的Docker容器中的示例工作流程(如下所述),它说明了基本XGBoost模型培训和测试在RAPIDS中的简单性。

 

安装Conda包
使用cuDF的最快方法是通过conda。

准备:
*NVIDIA Pascal™GPU架构或更好
*CUDA 9.2或10.0
*Ubuntu 16.04或18.04


Conda安装
您可以使用Miniconda进行最小的conda安装,或使用Anaconda进行全面安装。 使用conda命令安装和更新cuDF:

$ conda install -c numba -c conda-forge -c rapidsai -c defaults cudf=0.2.0

运行RAPIDS容器
RAPIDS Docker容器配置为运行RAPIDS并提供示例数据/笔记本以快速入门。

准备:
*NVIDIA Pascal™GPU架构或更好
*CUDA 9.2或10.0
*Ubuntu 16.04或18.04
*Docker CE v18 +
*nvidia-docker v2 +
启动Container和Notebook Server

$ docker pull rapidsai/rapidsai:ubuntu1604_cuda92_py35
$ docker run --runtime=nvidia \
        --rm -it \
        -p 8888:8888 \
        -p 8787:8787 \
        -p 8786:8786 \
        rapidsai/rapidsai:ubuntu1604_cuda92_py35
jupyter@container:/$ cd rapids && source activate gdf
(gdf) jupyter@container:/$ tar -xzvf data/mortgage.tar.gz --directory=data
(gdf) jupyter@container:/$ bash utils/start_jupyter.sh

注意:这将在主机上的端口8888上运行JupyterLab,并使用默认的token/password。

高级用法
请参阅Docker Hub上的Docker README。

PAPIDS:https://rapids.ai/documentation.html

README:https://hub.docker.com/r/rapidsai/rapidsai/

GitHub:https://github.com/RAPIDSai

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值