跟着chatgpt一起学
文章平均质量分 76
薇酱
=。=
展开
-
分布式执行引擎ray入门--(5)Ray Serve
默认在服务在http://127.0.0.1:8000/ 运行。确保server脚本启动。原创 2024-03-11 23:57:09 · 911 阅读 · 0 评论 -
分布式执行引擎ray入门--(4)Ray Tune
使用ray调参一共只需要3步:① 定义目标函数② 定义搜索空间③ 启动一个Tune运行并打印出最佳结果。原创 2024-03-11 10:00:00 · 1244 阅读 · 0 评论 -
分布式执行引擎ray入门--(3)Ray Train
Ray Train中包含4个部分: 包含训练模型逻辑的函数: 用来跑训练的配置: 协调以上三个部分。原创 2024-03-10 17:13:29 · 905 阅读 · 0 评论 -
分布式执行引擎ray入门--(2)Ray Data
今天来带大家一起来学习下ray中对数据的操作,还是非常简洁的。原创 2024-03-10 16:29:12 · 1334 阅读 · 0 评论 -
分布式执行引擎ray入门--(1)简介
Ray 是一个高性能的分布式执行引擎,开源的人工智能框架。旨在帮助开发者在原有代码上添加几行代码就可以进行分布式训练。它由如下几个部分构成:1)可扩展的库用于常见的机器学习任务,如数据预处理、分布式训练、超参数调优、强化学习和模型服务。2)Python风格的分布式计算原语用于并行化和扩展Python应用程序。3)集成和实用工具用于将Ray集群与现有工具和基础设施(如Kubernetes、AWS、GCP和Azure)集成和部署。原创 2024-03-03 16:34:20 · 531 阅读 · 0 评论 -
跟着chatgpt一起学|clickhouse入门(4)数据导入和查询
本篇将会带大家尝试下,使用clickhouse客户端工具(clienthouse-client)以及python代码的方式,来进行数据的导入和查询。原创 2023-12-25 23:54:15 · 521 阅读 · 0 评论 -
跟着chatgpt一起学|clickhouse入门(3)MergeTree
使用chatgpt帮我学习clickhouse中的MergeTree引擎原创 2023-12-10 19:23:38 · 1035 阅读 · 0 评论 -
跟着chatgpt一起学|2.Clickhouse入门(2)
让chatgpt帮我整理clickhouse的学习路径原创 2023-12-10 18:01:06 · 1103 阅读 · 0 评论 -
跟着chatgpt一起学|2.clickhouse入门(1)
上周我们一起学习了spark,这周让chatgpt帮我们规划下clickhouse的学习路径吧!原创 2023-12-02 21:35:21 · 878 阅读 · 0 评论 -
跟着chatgpt一起学|1.spark入门之MLLib
首先找到spark官网里关于MLLib的链接spark内一共有2种支持机器学习的包,一种是spark.ml,基于DataFrame的,也是目前主流的另一种则是spark.mllib,是基于RDD的,在维护,但不增加新特性了所以这一节的学习以spark.ml中的pipeline为主。其他的和sklearn里的非常像,大家可以自己去看。基于DataFrame创建pipeline,对数据进行清洗/转换/训练。原创 2023-11-26 20:45:31 · 526 阅读 · 0 评论 -
跟着chatgpt学习|1.spark入门(2)
总的来说,Spark作业调度器负责将应用程序划分为可执行的任务,并将这些任务分配给可用的执行器进行并行执行。6. 调度器还会考虑数据本地性,尽可能将任务分配给存储有相关数据的工作节点,以减少数据传输的开销。2. 调度器根据应用程序的需求和集群的可用资源,将作业划分为一系列任务(Tasks)。7. 调度器会监控任务的执行状态,并处理失败的任务,例如重新分配或重新执行失败的任务。这种方式通常适用于需要。根据数据的键的范围将数据划分为不同的分区。4. 调度器会根据任务的依赖关系和数据分区,决定任务的执行顺序。原创 2023-11-26 15:50:25 · 658 阅读 · 0 评论 -
跟着chatgpt学习|1.spark入门
总结起来,Cluster Manager负责资源的分配和任务调度,Driver负责解析用户程序并协调任务的执行,而Executor负责实际执行任务并返回计算结果。它们三者一起协作,实现了Spark应用程序的分布式计算。是Spark提供的机器学习库,包含了常见的机器学习算法和工具,用于数据挖掘和模型训练。Cluster Manager(集群管理器)DataFrame和DataSet。弹性分布式数据集(RDD)Executor(执行器)分布式文件系统和数据源支持。Driver(驱动器)原创 2023-11-26 12:24:17 · 1243 阅读 · 0 评论