- 博客(72)
- 收藏
- 关注
原创 更高效的多模态推理能力,Kimi-VL 一键部署教程!
Kimi-VL 项目是 Kimi Team 于 2025 年 4 月发布的大语言模型,这是一种高效的开源专家混合 (MoE) 视觉语言模型 (VLM),可提供高级多模态推理、长上下文理解和强大的代理功能。
2025-06-06 19:44:28
131
原创 VASP 教程:VASP 结合 Phonopy 计算硅的比热容
VASP 全称为 Vienna Ab initio Simulation Package()是一个计算机程序,用于从第一性原理进行原子尺度材料建模,例如电子结构计算和量子力学分子动力学。Phonopy()是一款用于在简谐和准简谐水平下计算声子能带结构、热学性质、群速度以及其他与声子相关物理量的 python 工具包。本次教程将使用自动化脚本来使用 Phonopy 进行演示计算流程。
2025-05-30 18:46:02
847
原创 【内含 OpenAI API 调用教程】超强逻辑推理能力,vLLM + Qwen-30B-A3B 登场!
Qwen3 项目是由阿里 Qwen 团队于 2025 年发布,相关技术报告为。Qwen3 是 Qwen 系列中最新一代大型语言模型,提供全面的密集模型和混合专家 (MoE) 模型。Qwen3 基于丰富的训练经验,在推理、指令遵循、代理能力和多语言支持方面取得了突破性进展。Qwen3 支持在思考模式(用于复杂逻辑推理、数学和编码)和 非思考模式(用于高效通用对话)之间无缝切换,确保在各种场景下的最佳性能;
2025-05-26 20:02:00
416
原创 VASP 教程:VASP 结合 phonopy 计算硅的声子谱
是一个计算机程序,用于从第一性原理进行原子尺度材料建模,例如电子结构计算和量子力学分子动力学。Phonopy () 是一款用于在简谐和准简谐水平下计算声子能带结构、热学性质、群速度以及其他与声子相关物理量的 python 工具包。本次教程将使用自动化脚本来进行 phonopy 进行演示计算流程。
2025-04-28 19:42:17
725
原创 更强的视觉 AI!更智能的多模态助手!Qwen2.5-VL-32B-Instruct-AWQ 来袭
选择「NVIDIA RTX A6000」以及「PyTorch」镜像,OpenBayes 平台提供了 4 种计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。首先点击「Upload」上传图片或视频,在「Input」中输入对话内容,然后点击「Submit」发送。,在「公共教程」页面,选择键部署 「一键部署 Qwen2.5-VL-32B-Instruct-AWQ」教程。待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。
2025-04-17 21:11:12
312
原创 更高效!更准确!YOLOE 实现实时目标检测
在「Visual Type」一栏中选择视觉类型,在「Intra/Cross Image」一栏中选择模式,在「Model」一栏中选择好模型并设置好参数后,点击「Detect & Segment Objects」开始检测。masks:例如上传一个包含很多人的图像,想检测人的图像,使用 masks 将一个人涂抹,推理时模型就会根据 masks 的内容识别图像中所有的人。待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。下面一一为大家演示。
2025-04-14 16:16:54
765
原创 AI 也能有温度,CSM-1B 一键生成更有情感的双人语音对话
该模型基于多模态学习框架,结合文本和语音数据,采用端到端的 Transformer 架构直接生成自然且富有情感的语音,可根据文本和音频输入生成 RVQ 音频代码。选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像,OpenBayes 平台提供了 4 种计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。
2025-04-11 18:30:52
370
原创 VASP 教程:NVT 系综下的分子动力学
Vienna Ab initio Simulation Package (VASP) 是一个计算机程序,用于从第一性原理进行原子尺度材料建模,例如电子结构计算和量子力学分子动力学。在 VASP 中进行分子动力学模拟时,不需要提供力场参数,只需提供原子的初始结构即可。VASP 将通过电子波函数的正交化求解原子受力,进而求解牛顿运动方程,从而模拟原子的运动轨迹。本次教程将演示 NVT 系综下的分子动力学,通过本教程,您将了解 VASP 分子动力学的:以 NVT 为例。MDALGO = 2。
2025-04-11 13:40:15
576
原创 Retinex 算法 + MATLAB 软件,高效率完成图像去雾处理
在计算机视觉领域,图像去雾是一项重要的预处理任务,尤其是在自动驾驶、遥感图像分析以及监控系统中,去雾能够有效提升图像质量,使目标更加清晰可见。Retinex (Retina + Cortex) 是 Land 和 McCann 提出的图像增强算法,主要基于人眼视觉系统对亮度变化的适应性。
2025-04-01 21:03:59
1040
原创 支持视频检测, YOLOv12 目标检测刷新速度、精度双记录
镜像,OpenBayes 平台提供了 4 种计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。在「Input Type」一栏选择「Image」,上传一张图片,在「Model」处选择模型,默认为「yolov12m.pt」。在「Input Type」一栏选择「Video」,上传一段视频,在「Model」处选择模型,默认为「yolov12m.pt」。的推出改变了这一局面!待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。
2025-03-31 16:08:31
554
原创 文-图生视频双发力,Wan 2.1 高质量视频生成教程
它的触手伸展开来,环绕在身体周围,眼睛闭着。在功能上,该模型不仅支持文生视频和图生视频,还能进行视频编辑、文生图、视频生音频等多种创新应用,极大丰富了用户的创作选择。选择「NVIDIA RTX A6000」以及「vLLM」镜像,OpenBayes 平台提供了 4 种计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。我们在「Prompts」中输入一段文字描述,在「Resolution」处选择输出尺寸,根据自己需求设置好帧数和推理步数,最后点击「Generate」生成。
2025-03-26 18:45:09
441
原创 比肩 DeepSeek-R1 满血版,vLLM 部署 QwQ-32B 教程
该模型是 Qwen 团队使用强化学习 (RL) 提升模型性能的新尝试,QwQ-32B 拥有 320 亿参数,性能却可与拥有 6710 亿参数(激活 370 亿)的 DeepSeek-R1 相媲美。选择「NVIDIA RTX A6000」以及「vLLM」镜像,OpenBayes 平台提供了 4 种计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。
2025-03-24 19:10:22
507
原创 单卡 4090 即可启动,一键部署 QwQ-32B-AWQ 教程
选择「NVIDIA GeForce RTX 4090」以及「vLLM」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。并且相比传统指令调优模型,QwQ 具备思考和推理能力。,在「公共教程」页面,选择键部署 「一键部署 QwQ-32B-AWQ」教程。页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。
2025-03-21 15:22:12
166
原创 Manus 超强开源版本,OpenManus + QwQ-32B 实现 AI Agent
选择「NVIDIA GeForce A6000」以及「vLLM」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「打开工作空间」,即可进入 Jupyter 工作页面。,在「公共教程」页面,选择键部署 「OpenManus + QwQ-32B 实现 AI Agent」教程。点击「API 地址」处的小箭头跳转。页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。
2025-03-13 17:30:58
412
原创 更强的蛋白质突变效应预测!一键推理 DePLM 去噪蛋白质语言模型
浙江大学陈华钧教授、张强研究员、王泽元博士等人提出的全新的去噪蛋白质语言模型 (DePLM),可以将蛋白质语言模型捕捉到的进化信息视为与优化目标特性相关和无关的混合体,其中无关信息被视为「噪音」并消除,进而提高模型在预测蛋白质适应性景观时的准确性,帮助识别功能最优序列以进行优化。选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。
2025-03-07 14:28:04
365
原创 DeepSeek 开源多模态大模型 Janus-Pro-7B,一键完成图像理解 & 文生图
Janus-Pro 是一种新颖的自回归框架,它统一了多模态理解和生成,由中国 AI 企业 DeepSeek 于 2025 年开发的开源多模态大模型,它通过将视觉编码解耦到单独的路径来解决以前方法的局限性,同时仍然使用单一的、统一的转换器体系结构进行处理。选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。
2025-03-06 20:02:06
673
原创 数字人技术再超越,TANGO 可生成与音频匹配的全身手势视频
选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。进入 Demo 界面后,在「Upload your audio」处上传音频,在「Your Character」处上传视频,「Seed」可设置随机种子数。最后点击「Generate Video」生成。稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。
2025-02-28 19:03:13
657
原创 苹果开源高效率模型 Depth Pro, 1s 实现高精度单目深度测量
Depth Pro 能零样本学习 (zero-shot learning),在没有特定领域数据训练的情况下,能做出准确的预测,使其在增强现实、3D 重建和图像编辑等多个领域都有广泛的应用潜力。选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。
2025-02-26 16:03:17
332
原创 用 AI 听书的时代来了!Ebook2Audiobook 一键电子书转有声书
该项目利用先进的文本到语音 (Text-to-Speech, TTS) 技术,将电子书中的文本内容自动转换为语音,生成可供用户收听的有声书。那一天,我也将沉静着走下山去,扶着我的拐杖。选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。
2025-02-24 10:18:44
523
原创 国产超强开源大语言模型 DeepSeek-R1-70B 一键部署教程
此外,该模型是 DeepSeek AI 提供的一款推理增强型模型,支持多种应用场景,如移动设备与边缘计算、在线推理服务等,以提高响应速度和降低运营成本,其具备非常强大的推理和决策能力。它是基于 Llama3.3-70B-Instruct 进行训练的,采用强化学习和蒸馏技术提升推理表现,不仅继承了 Llama 系列模型的优势,还在此基础上进一步优化了推理能力,尤其在数学、代码与逻辑推理任务中表现突出。,在「公共教程」页面,选择「一键部署 DeepSeek-R1-70B」教程。
2025-02-21 16:35:23
3018
1
原创 大模型推理的「加速神器」,使用 vLLM 对 Qwen2.5 推理实操教程
选择「NVIDIA GeForce RTX 4090」以及「vLLM」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。如果我们对模型进行微调,那么系统就不那么重要了,因为无论我们使用哪个系统提示,模型都会从目标中学习该做什么。该教程为使用 vLLM 加载 Qwen2.5-3B-Instruct-AWQ 模型进行少样本学习,包括模型的加载、数据的准备、推理过程的优化,以及结果的提取和评估。使用 vLLM(为了提高速度)
2025-02-19 14:31:22
689
原创 可简化并加速 LLM 应用程序开发,LangChain 与 vLLM 结合使用教程
选择「NVIDIA GeForce RTX 4090」以及「vLLM」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。LangChain 是提供构建复杂操作链的工具,而 vLLM 专注于高效的模型推理,两者结合应用可以简化并加速智能 LLM 应用程序的开发。,在「公共教程」页面,选择「将 LangChain 与 vLLM 结合使用教程」教程。稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「打开工作空间」。
2025-02-14 16:00:25
490
原创 小学生也在用的 AI 神器,国产开源大语言模型 DeepSeek R1 一键启动教程!
该系列模型通过先进的技术优化,如知识蒸馏,旨在在保持高性能的同时降低计算资源需求。选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。在技术层面,DeepSeek-R1 采用了知识蒸馏技术,通过从大模型中提取知识,训练出更小但性能接近的模型。稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。
2025-02-13 15:49:27
473
原创 你的抠图好帮手!RMBG-2.0 一键启动教程
选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。点击「input url」,输入图片 URL,点击「Submit」生成。,在「公共教程」页面,选择「RMBG-2.0:开源背景去除模型」教程。2. 图片URL上传进行去除背景(input url)
2025-01-24 15:06:30
397
原创 超强推理大模型 QVQ-32B-preview 一键部署
这个模型在多个基准测试中展现了卓越的性能,特别是在 GPQA、AIME、MATH-500 和 LiveCodeBench 等测试中,准确率分别达到了 65.2%、50.0%、90.6% 和 50.0%。选择「NVIDIA RTX A6000」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。
2025-01-23 19:45:34
831
原创 VASP 教程:杂化泛函计算硅的态密度和能带
INCARENCUT = 300 (波函数截断能量)PREC = Normal (精度设置)LWAVE = .TRUE. (保存波函数)LCHARG = .TRUE. (保存电荷)ADDGRID= .TRUE. (增加格点加速收敛)ISMEAR = 0 (高斯占据数)SIGMA = 0.1 (高斯展宽)LORBIT = 11 (输出 DOSCAR 和 PROCAR)NELM = 60 (最大电子步)EDIFF = 1E-08 (电子步收敛判据)
2025-01-22 18:06:21
832
原创 AlphaFold3 一键部署,高准确性蛋白质建模工具
选择「NVIDIA A6000」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。5. 等待模型计算完成后,可在 /home/output/2pv7 目录中找到 cif 文件,将其下载到本地。,在「公共教程」页面,选择「AlphaFold3 蛋白质预测 Demo」教程。稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「打开工作空间」。页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。
2025-01-22 14:42:00
657
原创 vLLM 教程:使用 vLLM 加载大模型进行少样本学习
选择「NVIDIA GeForce RTX 4090」以及「vLLM」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。进入到工作空间后,打开左侧目录中的「README.ipynb」文件即可查看教程的运行步骤。,在「公共教程」页面,选择「使用 vLLM 加载大模型进行少样本学习」教程。稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「打开工作空间」。页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。
2025-01-21 15:36:09
1104
原创 VASP 入门教程:计算硅的态密度和能带
结构优化ISTART=1(读取初始波函数WAVECAR文件)ISPIN=1(本次计算为不考虑自旋的DFT计算)#ICHARG=11(非自洽计算:用于计算能带本征值)LREAL=.FALSE.(不在实空间投影计算)LWAVE=.TRUE.(计算完毕输出并保存WAVECAR)LCHARG=.TRUE.(计算完毕输出并保存CHGCAR)ADDGRID=.TRUE.(增加格点密度加速收敛)NSW=300(最多运行300步离子步)
2025-01-17 17:25:46
1739
原创 LTX-Video 高效视频生成模型,一键处理图片&文字
点击「Text to Video」,在「Enter Your Prompt」中输入生成视频的文本提示词,在「Enter Your Negative Prompt」中输入负面提示词,即不希望出现在视频中的元素。点击「Image to Video」,上传一张图片,在「Enter Your Prompt」中输入生成视频的文本提示词,在「Enter Your Negative Prompt」中输入负面提示词,最后点击「Generate Video」生成。页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。
2025-01-17 14:12:48
1372
1
原创 Shouxin 使用教程,一键生成铅笔素描风格图像
选择「NVIDIA A6000」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。需要注意的是为了触发铅笔素描风格的图像生成,请使用「shou_xin」或「pencil sketch」关键词,可参考官方给出的示例。稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。,在「公共教程」页面,选择「铅笔素描风格文生图 shouxin」教程。
2025-01-16 18:54:20
397
原创 ShowUI:GUI 智能小助手,自动完成复杂的用户界面任务
ShowUI 是由新加坡国立大学 Show Lab 和微软于 2024 年共同开发的视觉-语言-行动模型,专为图形用户界面 (GUI) 智能助手设计,旨在提高人类工作的效率,这个模型通过理解屏幕界面的内容,并执行如点击、输入、滚动等交互动作,支持网页和手机应用场景,能够自动完成复杂的用户界面任务。选择「NVIDIA 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。大家可以根据自己需求进行上传。
2025-01-16 18:45:31
335
原创 vLLM 入门教程:如何配置和运行 vLLM
运行「python3 -m vllm.entrypoints.openai.api_server --model /input0/Qwen-1_8B-Chat/ --host 0.0.0.0 --port 8080 --dtype auto --max-num-seqs 32 --max-model-len 4096 --tensor-parallel-size 1 --trust-remote-code」命令启动服务器。页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。
2025-01-14 14:34:31
925
原创 腾讯 Hunyuan3D-1.0 教程,超真实 3D 图像生成
Hunyuan3D-1.0 是由腾讯公司研究团队于 2024 年推出的 3D 生成扩散模型模型,包括一个轻量版和一个标准版,均支持从文本和图像输入生成高质量的 3D 资产,轻量版模型能在大约 10 秒内生成 3D 物体,而标准版则在大约 25 秒内完成,标准版本比精简版和其他现有模型多 3 倍参数。本教程是 Hunyuan3D-1.0 轻量版,包含 2 个功能:「图像生成 3D (image to 3D)」和「文本转 3D (text to 3D)」图像生成 3D(image_to_3D)
2025-01-13 15:34:58
637
原创 腾讯 HunyuanVideo 上线,自定义文本生成视频
HunyuanVideo 是目前开源模型中参数量最大的文生视频模型,拥有 130 亿参数,能够生成具有高物理准确性和场景一致性的视频内容,为用户提供超写实的视觉体验,并能够在真实与虚拟风格之间自由转换。选择「NVIDIA A100」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。
2025-01-03 17:53:08
608
原创 文档解析神器 Docling 上线,快速转换文件格式
选择「NVIDIA RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。进入模型后,上传我们的文件(支持的文件类型有:PDF、DOCX、PPTX、MD、ASCIIDOC),然后选择目标文件类型(Text、Markdown、Doctags、Json、Yaml),点击「Docling」转换。登录 OpenBayes.com,在「公共教程」页面,选择「Docling:文档解析神器」教程。
2025-01-03 17:42:40
618
原创 InkSight 上线!AI 识别手写文字,拥有更高识别准确率
这项技术的核心优势在于其独特的学习方法,它通过模仿人类阅读和学习的过程,不断地重写和学习手写文本,从而积累对文字外观和含义的理解。选择「NVIDIA RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。
2024-12-20 18:44:40
384
原创 语言模型 F5-E2 TTS:音色 & 情绪一键克隆,轻松实现多角色对话
选择「TTS」,在「Reference Audio」处上传需要克隆的音频(例如:甄嬛的音频),在「Text to Generate」中输入文本提示词( F5-TTS 的主要功能包括零样本声音克隆、速度控制、情感表现控制、长文本合成以及多语言支持。页面跳转后,选择「NVIDIA RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。
2024-12-16 19:38:23
1537
原创 AI 数字人模型 Hallo2:让图片开口说话,一键修复模糊人脸
在终端中输入并运行「python app.py」,待出现 8080 端口后,点击「API 地址」的箭头处即可前往 gradio 界面。进入到工作空间后,我们新建一个「终端」,然后运行「chmod +x setup_environment.sh」,为配置环境的脚本添加可执行权限。点击「Generate Video」,这里我们上传了一段嬛嬛的语音和一张图片,点击「Generate Video」生成。稍等片刻,待系统分配好资源,状态栏显示为「运行中」后,点击「打开工作空间」进入模型。
2024-12-09 19:30:38
642
原创 ScribblePrompt 医学图像分割工具,三种标注方式助力图像处理
平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 RTX 4090 的算力和 PyTorch 的镜像,按照需求选择「按量付费」或「包日/周/月」,点击「审核并执行」。点击「Clicks/Boxs」,使用绿色点图,尝试点击多个点位。该项目有 3 种标注方式,分别为「Scribbles」、「Clicks/Boxs」、「Bounding Box」,下面我们逐一进行演示。点击「Scribbles」,使用绿色图标对我们希望检测的目标区域进行填涂,然后点击「Refresh Prediction」。
2024-12-01 20:06:32
822
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人