自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(105)
  • 收藏
  • 关注

原创 OpenBayes 一周速览|轻量化、更具性价比的大模型 Gemma 3 部署教程上线!KodCode-V1 赋能智能编程与自动化开发,简化开发流程

MiniMind 包含了多个数据集,例如用于训练分词器的 tokenizer 训练集、用于预训练模型的 Pretrain 数据、用于监督式微调的 SFT 数据、以及用于训练奖励模型的 DPO 数据 1 和 DPO 数据 2。该数据集专为编码任务提供可验证的解决方案和测试,包含 12 个不同的子集,涵盖各个领域(从算法到特定于软件包的知识)和难度级别(从基本的编码练习到面试和竞争性编程挑战),专为监督微调 (SFT) 和 RL 调优而设计。QwQ-32B 是阿里巴巴开源的新型推理模型,参数量为 32B。

2025-03-26 18:28:37 689

原创 OpenBayes 教程上新丨CSM 驾到,统统闪开!更鲜活的语音生成,从此告别延迟呆板机械味

当状态变为「运行中」后,点击「API 地址」旁边的跳转箭头,即可跳转至 Demo 页面。语调呆板、停顿突兀,时不时还在莫名其妙的地方卡顿,这种似人非人的违和感,其实就是「恐怖谷效应」在作祟。OpenBayes 提供了 4 种计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,新用户使用下方邀请链接注册,可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费时长!,在「公共教程」页面,选择「CSM 双人对话语音生成 Demo」。高效的推理架构,让语音生成更接近实时,提升交互效率。

2025-03-26 18:08:29 226

原创 OpenBayes 教程上新丨单卡A6000轻松部署Gemma 3,精准识别黄仁勋演讲实拍

在应用场景上,多模态大模型 Gemma 3 能够处理文本和图像输入,并生成文本输出,适用于各种文本生成和图像理解任务,包括问答、摘要和推理。本次开源的 1B、4B、12B 和 27B 四种参数版本,既有预训练模型,也有通用指令微调版本,可以直接在手机、笔记本电脑和工作站等设备上快速运行。OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,没抢到文章开头邀请码的用户可以使用下方邀请链接注册,可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费时长!

2025-03-20 17:38:01 832

原创 OpenBayes 教程上新 | OpenManus 与 QwQ-32B 强强联合,推理过程全透明

OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,新用户可以使用文章开头的邀请码进行注册,没抢到邀请码的朋友别灰心,使用下方邀请链接注册,可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费时长!当接到任务后,不同分工的 Agent 会紧密协作,从需求理解、规划制定到具体行动执行,全程公开透明化,过程中如何思考问题、怎样规划执行步骤,都能实时反馈给用户,让人们可以及时的干预,有助于模型更高质量的完成任务。将项目文件保存在 game 目录下。

2025-03-12 17:09:10 783

原创 OpenBayes 一周速览 | Wan 2.1 文/图生视频秒上手,精度清晰度双飞跃;解锁视觉+语言新高度!Janus-Pro-7B 模型一键启动

MCTS 中文文本简化数据集* Big-Math 强化学习数学数据集* HAR 15 种人体动作识别数据集* DexGraspVLA 机器人抓握数据集* Fortune Telling 中文风水占卜数据集* QwQ-32B* 一键部署 YOLOv12* 一键部署 Janus-Pro-7B* Wan 2.1 文/图生视频双杀 Demo。

2025-03-10 18:41:43 589

原创 OpenBayes 教程上新 | 性能比肩满血版 DeepSeek-R1,QwQ-32B 一键部署教程上线

上周,阿里云突发大招,强势开源了全新推理模型通义千问 QwQ-32B。QwQ-32B 不仅性能哇塞,在保持强劲性能的同时,它还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署,堪称实力与性价比的典范。QwQ-32B 在多项基准测试中与 DeepSeek-R1-671B 等推理模型的跑分对比技术层面,QwQ-32B 在冷启动的基础上采用了两阶段的强化学习法,第一阶段专注于数学和代码任务,借助数学验证器和代码沙盒,着重提升模型的逻辑推理能力。

2025-03-10 18:17:39 571

原创 OpenBayes 一周速览|vLLM 高效部署 DeepSeek-R1,加速模型推理!超 20w 图像-文本配对,GAIA 视觉语言遥感数据集发布

该数据集专为研究扑翼机器人机翼的深度逆映射模型而创建,旨在为拍翼机器翼的控制提供一种新的学习框架。作为 DeepSeek 系列的高性能版本,它在多个基准测试中表现出色,支持多种应用场景,如移动设备与边缘计算、在线推理服务等,以提高响应速度和降低运营成本,其具备非常强大的推理和决策能力。该数据集是一个用于遥感图像分析的全球性、多模态、多尺度视觉-语言数据集,旨在弥合遥感 (RS) 图像与自然语言理解之间的差距,它提供了 205,150 对图像-文本配对,覆盖了多样化的地理区域、卫星任务和遥感模态。

2025-03-06 16:25:22 581

原创 OpenBayes 教程上新| 速度与精度双巅峰!YOLOv12 参数做减法,性能做加法

近日,纽约州立大学布法罗分校联合中国科学院大学发布的 YOLOv12 版本,在继承模型以往版本高效特性的同时,引入了区域注意力机制 (area-attention) 和残差高效层聚合网络 (R-ELAN),极大降低了计算复杂度,显著提升了运行速率,还有效解决了注意力机制衍生的优化难题。选择「Image」板块,上传图片并调整参数后,点击「Detect Object」,YOLOv12 精准且高效地完成实时检测任务,无论是较大的人物目标,还是细微如领带的物体,均能被精准识别。

2025-03-06 15:59:43 548

原创 OpenBayes 一周速览|DeepSeek 教程+推理数据集大放送!2.6k星,Step-Audio-TTS 方言切换超丝滑

Dolphin-R1 推理数据集* LIMO 数学推理基准数据集* OpenThoughts-114k 推理数据集* OpenR1-Math-220k 数学推理数据集* Bespoke-Stratos-17k 推理任务数据集* 一键部署 DeepSeek-R1-70B* Step-Audio-TTS-3B 产品级方言语音生成模型* 用 Ollama 和 Open WebUI 部署 DeepSeek R1。

2025-02-27 17:18:34 877

原创 OpenBayes 教程上新 | 精准生成面部表情与动作,首个 AI 短剧创作神器 SkyReels-V1-Hunyuan-I2V 上线

3. 选择「NVIDIA RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。霸总短剧热度一直居高不下,成为文娱消费新宠。然而,传统创作模式却给短剧创作套上了枷锁:拍摄耗时久,资金投入大,后期剪辑工序繁杂,致使创作效率低下,作品产出受限。当状态变为「运行中」后,点击「API 地址」旁边的跳转箭头,即可跳转至 Demo 页面。2. 页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。

2025-02-27 16:58:33 293

原创 OpenBayes 教程上新丨语音合成/音乐合成/声音克隆,Step-Audio-TTS 让石矶娘娘秒变川渝辣妹

DeepSeek 开源引发的全球热潮余温尚在,近日,阶跃星辰携手吉利汽车集团再度出手,强势开源了 Step-Audio-TTS-3B 模型,再次引发了业内的广泛讨论。曾几何时,而 Step-Audio-TTS-3B 则能够生动演绎地方语言的特色。它基于 LLM-Chat 范式大规模合成数据集进行训练,深入洞悉语言的结构,从字里行间把握语言的微妙变化,无论是热情似火的四川话,还是九调六声的粤语,它都能精准抓住其韵律与语气,展现浓浓的地方风情。

2025-02-21 17:13:27 631

原创 OpenBayes 一周速览 | NVIDIA 再放大招!Cosmos 与 AceMath 数理双修,赋能物理仿真与数学推理,推动 AI 跨学科发展

MatterGen 是一个用于跨周期表设计无机材料的生成模型,可以通过微调来引导生成满足各种属性约束的材料。DeepSymNet 是一个可以表示任何表达式的完整网络,该数据集展示了 DeepSymNet 的整体框架,第一层为数据,中间层是隐藏层,最后一层是输出层。该数据集是由 NVIDIA 于 2025 年发布的一个用于训练 AceMath 模型的数据集,旨在提升模型在数学推理任务中的表现。该数据集是来自不同年龄段的人的图像的集合,专门为年龄预测和面部识别任务而设计的,包含不同的人口统计数据、种族和性别。

2025-02-12 18:45:24 733

原创 OpenBayes 教程上新 | 告别服务器繁忙,DeepSeek 一键部署教程上线!

3. 选择「NVIDIA RTX A6000」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。1. 打开 API 地址,输入问题(例如:我是 3 年级的小学生,请帮我写一篇周记,要求 400 字左右),打开「联网搜索」后,点击发送。帮你告别「服务器繁忙」,开启丝滑对话。然而,在人们争相体验这个高性能 Chatbot 时,却总是遇到「服务器繁忙,请稍后再试」的冰冷回复,让很多用户头疼不已。

2025-02-12 18:20:50 930

原创 OpenBayes 一周速览|微软 Phi-4 发布,以小博大,降低更多成本实现高效推理;Terra 时空数据集上线,648 万网格点,覆盖全球数据

5 个数据集:* Terra 多模态时空数据集* Chinese Couplets 中文对联数据集* Aqueous Solubility 无机化合物数据集* Human Like DPO Dataset 大模型对话微调数据集* Sentiment and Emotion Analysis Dataset 情感情绪分析数据集4 个教程:* 一键部署 Phi-4* Docling:文档解析神器* 一键部署 QVQ-72B-preview* 铅笔素描风格文生图 shouxin访问官网立即使用:http://op

2025-01-20 18:11:23 889

原创 OpenBayes 一周速览|文字秒变铅笔素描画,shouxin让创作零门槛!国内首个综合交通大模型训练数据开源,含 40k+ 交通领域文本

该数据集覆盖 11 个网络安全大类领域、 42 个子类领域,4,369 多项选择题、判断题、知识抽取题,提供知识型和实战型的综合评估任务,支持用户自主评测,同时为大模型落地网络安全提供参考和启发。TableBench 是一个人工注释的全面而复杂的 TableQA 基准,包含 18 个领域的 886 个样本,旨在促进事实核查、数字推理、数据分析和可视化任务。该数据集包含了约 34.6 万条交通领域文本数据,这些数据用于领域内预训练,以及约 5.8 万条交通领域对话数据,用于微调。

2025-01-13 17:28:38 509

原创 OpenBayes 教程上新丨lammps 入门:npt 控温估计 FCC 铜的熔点

在材料科学中,了解材料的熔点对于工业应用至关重要。1. 等待模型运行完成后,输入「apt-get update --fix-missing」更新 apt 源,更新好之后输入「apt install gnuplot」安装 gnuplot(画图工具),并输入「y」回车确认。3. 选择「NVIDIA RTX 4090」算力,按照自己需求选择「按量付费」或「包日/周/月」,镜像选择「lammps」,最后点击「继续执行」。2. 打开「终端」,输入「cd melt_u3」进入解压目录,使用「ls」命令查看文件。

2025-01-13 16:24:49 576

原创 OpenBayes 一周速览丨ShowUI专注GUI自动化,可解析屏幕截图和用户指令;U-MATH数据集上线,含1.1k个未公开的大学水平数学问题

HunyuanVideo 是目前开源模型中参数量最大的文生视频模型,拥有 130 亿参数,能够生成具有高物理准确性和场景一致性的视频内容,为用户提供超写实的视觉体验,并能够在真实与虚拟风格之间自由转换。这个模型通过理解屏幕界面的内容,并执行如点击、输入、滚动等交互动作,支持网页和手机应用场景,能够自动完成复杂的用户界面任务。在性能评测中,模型的参数规模约 70B,但各项评测指标约等于 405B 参数规模的 Llama3.1-405B 模型,意味着可以用更少的资源,更快地生成文本。

2025-01-09 16:27:13 796

原创 「AI 中国」榜单揭晓,OpenBayes贝式计算入选「大模型最具潜力创业企业 TOP 10」

「AI 中国」机器之心 2024 年度评选正式揭晓,OpenBayes贝式计算有幸入选「大模型最具潜力创业企业 TOP 10」。

2024-12-31 14:05:44 284

原创 OpenBayes 一周速览|入选 NeurIPS!浙大开源优化蛋白质语言模型 DePLM ;P-MMEval 基准数据集发布,覆盖十种语言评估

对话中的每个句子都被标记为 7 种情绪中的其中一种:愤怒、厌恶、悲伤、快乐、中立、惊讶和恐惧。去噪蛋白质语言模型 (DePLM),可以将蛋白质语言模型捕捉到的进化信息视为与优化目标特性相关和无关的混合体,其中无关信息被视为「噪音」并消除,进而提高模型在预测蛋白质适应性景观时的准确性,帮助识别功能最优序列以进行优化。该数据集包含 3 种指令:分子导向指令、蛋白质导向指令和生物分子文本指令,旨在提供丰富的指令数据,以增强大型语言模型在生物分子领域的理解和预测能力。* GROMACS 入门教程:水中的溶菌酶。

2024-12-16 22:23:20 865

原创 vLLM 教程上新!覆盖从入门到进阶 4 种应用方式;中文文档同步上线,0 帧起手加速大模型推理

经过无数次的试验和调试中,他们关注到了操作系统中经典的虚拟内存和分页技术,并基于此在 2023 年提出了开创性注意力算法 PagedAttention,其可以有效地管理注意力键和值,进而构建了高吞吐量的分布式 LLM 服务引擎 vLLM,实现了 KV 缓存内存几乎零浪费,具体来讲,vLLM 不再立即处理输出,而是延迟处理,在执行第 n+1 步的同时处理第 n 步的输出。该教程详细展示了如何对一个 3B 参数的大语言模型的进行推理任务,包括模型的加载、数据的准备、推理过程的优化,以及结果的提取和评估。

2024-12-16 22:04:27 1237

原创 OpenBayes 一周速览|AlphaFold3 超大依赖数据库上线!一键 input,不占内存;ICLR 满分论文教程实战,AI 打光操控升级

它能够在单一框架内处理多种图像生成任务,包括文本到图像的生成、图像编辑、主题驱动生成和视觉条件生成等。OmniGen 的架构简化,不需要额外的文本编码器,让用户可以用指令完成复杂任务,无需额外的预处理步骤,简化了图像生成的工作流程。该数据集包含两个部分:WikiHop 和 MedHop,旨在构建能够执行多跳推理的阅读理解方法,即在不同文档中分散的事实需要通过多个步骤的推理来得出新的事实。该教程包含了两个模型的 Demo 使用,分别为 F5-TTS 和 E2 TTS,只需按照示例步骤运行,即可体验音色克隆。

2024-12-12 19:17:11 751

原创 OpenBayes 教程上新丨腾讯 Hunyuan3D-1.0 上线,10s 实现 3D 图像生成

点击「image to 3D」,在「Input image」中上传图像(注意:自行上传图像时,请务必保证图片为 n*n 的正方形,否则会出现报错的情况)。4. 页面跳转后,选择「NVIDIA RTX A6000」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「下一步:审核」。点击「text to 3D」,在「Input text」中输入文本提示词(一只棕白相间的仓鼠,站在白色背景前。生成图像的随机种子,默认为 0。

2024-12-12 18:46:25 960

转载 OpenBayes贝式计算创始人受邀参加第九届中国开源年会,分享 AI4S 前沿洞察

Open Source,Open Life,开源新生活!本届大会为期 2 天,以 「开源新生活 - Open Source, Open Life 」 为主题,汇聚了来自全国各地的技术精英、开源爱好者、行业领袖和媒体代表,共同见证了开源技术如何融入日常生活,推动社会进步。超过 1,000 余人次到达现场,在线直播观看人数总计 120,925 人,直播观看次数达 125,439 次。

2024-12-05 20:53:02 593

原创 OpenBayes 教程上新丨F5-E2 TTS 超强声音魔法,音色 & 情绪通通一键克隆!

近期,上海交通大学、剑桥大学和吉利汽车研究院(宁波)有限公司共同开源了一款高性能文本到语音 (TTS) 系统 F5-TTS ,E2-TTS:一款由微软发布的文本转语音系统,通过使用填充标记将文本输入扩展至与目标语音相同的长度,随后进行去噪处理,即可直接生成语音。,可以同时体验 F5-TTS 和 E2-TTS 2 个模型,无需输入任何命令,不仅可以轻松克隆音色,还可以准确克隆情绪,甚至模拟双人对话。

2024-12-05 18:55:13 758

原创 OpenBayes 一周速览|Hunyuan3D 极速生成 3D 资产,轻松驾驭多视角场景;HelpSteer2 助力 LLMs 更贴近人类偏好

Hunyuan3D-1.0 是一个 3D 生成扩散模型,支持从文本和图像输入生成高质量的 3D 资产,轻量版模型能在大约 10 秒内生成 3D 物体,而标准版则在大约 25 秒内完成,标准版本比精简版和其他现有模型多 3 倍参数。该模型是一种用于识别和验证由大语言模型 (LLM) 生成文本的水印技术,它的核心在于在不损害文本质量和用户体验的前提下,通过细微调整生成过程中的 Token 概率分数来嵌入几乎无法察觉的水印,从而实现高检测精度。* Evo:从分子到基因组规模的序列预测和生成。

2024-11-28 19:37:07 758

原创 36氪 WISE2024 商业之王落幕,OpenBayes贝式计算获评年度最具商业潜力企业

36氯年度重磅 S 级商业大会 「WISE2024 商业之王」在北京召开,「WISE2024 商业之王年度企业系列名册」正式揭晓,OpenBayes贝式计算从众多企业中脱颖而出,入选「WISE2024 商业之王年度最具商业潜力企业」。

2024-11-28 18:47:40 776

原创 OpenBayes 一周速览|一键部署Qwen2.5-Coder,0编程经验实现代码生成自由!化学多模光谱数据集上线,含79万光谱数据,助力分子发现

它包括一个用于算法评测的数据集,以及用于衡量领域差异的风格 (style)、类间方差 (Inter-class Variance, ICV)、无法定义的边界 (Indefinable Boundaries, IB) 等数据集指标。这项技术通过模仿人类阅读和学习的过程,不断地重写和学习手写文本,从而积累对文字外观和含义的理解。Muharaf 数据集是一个专注于手写阿拉伯文识别的机器学习数据集,包含 23,742 个全球分布的兴趣区域 (ROIs),覆盖了多样的土地利用模式,总共包含 400 万张图像。

2024-11-21 20:52:38 690

原创 OpenBayes 教程上新|YOLOv11 实战!速度与精度双全的目标检测神器

YOLO 模型一直是目标检测的经典之选。YOLOv11 作为新一代的目标检测模型,YOLOv11 能够同时完成多个视觉任务:从基础的物体检测和物体分类,到精细的实例分割,甚至能通过姿态估计分析人体或物体的动作。同时,YOLOv11 在定位物体检测方面也表现出色,能够精准地定位并识别图像中的目标,满足更复杂场景的需求。例如,在自动驾驶中,它不仅能精准识别前方车辆和行人,还能准确定位车道线和交通标志,确保行车安全。

2024-11-21 20:27:48 844

原创 OpenBayes 一周速览丨VASP 教程上线!HPC 助力材料计算;AllClear 公共云层去除数据集发布,含超 23k 个全球分布的兴趣区域

该技术能够应对长时间视频生成中的挑战,并实现高分辨率的视觉效果。用户还可以在对话中随时调整语速,或打断模型的输出以插入新的指令,实现更流畅的实时互动。它是目前材料模拟和计算物质科学研究中最流行的商用软件之一,其高准确性和强大的功能使其成为研究者进行材料性质预测和设计的重要工具,被广泛用于固体物理学、材料科学、化学、分子动力学等领域。AllClear 数据集是目前最大的公共云层去除数据集,包含 23,742 个全球分布的兴趣区域 (ROIs),覆盖了多样的土地利用模式,总共包含 400 万张图像。

2024-11-13 18:05:06 695

原创 OpenBayes 一周速览丨Ministral-8B革新侧端AI新体验!PsyDTCorpus心理咨询数据集上线,含5k个数字孪生对话数据

Food–101 数据集是包含 101 种食品类别的图像数据集,主要用于图像分类,共有 101k 张图像,每个类别的测试图像和训练图像分别有 250 张和 750 张,其中训练图像未经数据清洗,但所有图像均已重新进行尺寸缩放,最大边长在 512 像素。Labelme 是用于目标识别的图像数据集,涵盖 1k+ 个完全注释和 2k 个部分注释的图像,其中部分注释图像可以被用于训练标记算法,测试集拥有来自于世界不同地方拍摄的图像,这可以保证图片在续联和测试之间会有较大的差异。* SVHN 真实世界图像数据集。

2024-11-07 19:59:21 735

原创 包日、包周、包月功能上线,超优惠!

算力包日、包周、包月功能上线

2024-11-07 19:26:35 379

原创 OpenBayes 一周速览丨AI 配音+翻译+字幕一步到位!视频创作神器 Linly-Dubbing 在线使用;OMat24 无机材料数据集上线

它包含了 10,055 个训练实例和 1,047 个测试实例,涵盖了 55 种不同的计算任务。Cityscapes 数据集是一个专门针对城市街道场景的语义理解图片数据集,它包含了来自 50 个不同城市的街道场景,总共包含约 25k 张图像,其中有 5k 张是高质量像素级精细标注的图像,另外还有 20k 张是带有粗糙标注的图像。OMat24 是 Meta 开源的一个大规模无机材料数据集,包含约 1.1 亿个数据点,这些数据点是通过高精度的密度泛函理论 (DFT) 计算得到的,涵盖了多样性的结构和成分。

2024-10-29 18:29:54 552

原创 OpenBayes 教程上新 | 重回霸主地位,Stable Diffusion 3.5 轻松生成多元化风格图像

其中,Stable Diffusion 3.5 Large 是该系列中最强大的模型,拥有 80 亿参数,能够生成高达 100 万像素分辨率的图像,并且可以生成风格更为多样化的图像。今年 6 月,Stability AI 隆重发布了 Stable Diffusion 3 系列的首个开源版本 Stable Diffusion 3 Medium,虽然该版本在图像生成方面确实取得了一定的进步,但它在生成人像以及细节方面仍存在不足。2. 页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。

2024-10-29 17:37:09 648

原创 OpenBayes 一周速览|即刻体验Depth Pro,0.3秒get深度图;超高清视频生成模型上线,帧率高达24fps

该教程现已上线 OpenBayes 公共教程界面,只需一键克隆启动,即可轻松处理多样化的视觉任务,无论是静态图像的分析还是动态视频的解析,它都能够提供高质量的输出。包含来自 101 个物体类别的约 9k 张图像,不同类别有 40 至 800 张图片,每张图片的大小在 300x200 像素,且数据集的发布者均已标注对应的目标以供使用。SynthText 数据集由包含单词的自然场景图像组成,其主要运用于自然场景中的文本检测,该数据集由 80 万个图像组成,大约有 800 万个合成单词实例。

2024-10-24 12:59:24 921

原创 1024程序员节福利放送 | AI 照片修复魔法,一键重拾旧时记忆

为了让这些珍贵的老照片重焕光彩,B 站 Up 主是花子呀精心制作了「唤醒老照片」教程。不仅能够实现老照片的修复、还能够为黑白照片进行上色,甚至可以将静态的照片生成动态视频,让那些静止的瞬间活灵活现。目前该教程已经上线至 OpenBayes 公共教程中,点击克隆后只需简单 3 步即可重拾珍贵回忆

2024-10-24 12:26:52 791

原创 OpenBayes 一周速览丨YOLOv11 来了!多任务目标检测一个模型全搞定;一键部署 OpenAI 最新语音识别模型,下载超 13 万次!

问题涵盖了历史、体育、科学、动物、健康等多个主题,并且每个问题都标有推理类型,如数值、表格、多重约束、时间性和后处理。该模型为 Llama 3.2-Vision 的 11B 参数大小的指令微调模型,针对视觉识别、图像推理、字幕和回答有关图像的一般问题进行了优化,支持英语、德语、法语等 8 种语言。该数据集包含了约 255 亿个 tokens 的医疗预料数据,涵盖了 6 种主要语言:英语、中文、日语、法语、俄语和西班牙语,并且对更多语言的支持仍在不断更新和扩展中。MMMLU 多语言多任务语言理解数据集。

2024-10-15 18:40:50 1054

原创 OpenBayes 教程上新 | 打败 GPT-4V?超强开源多模态大模型 LLaVA-OneVision 正式上线!

来自字节跳动、南洋理工大学、香港中文大学和香港科技大学的研究人员共同开源了 LLaVA-OneVision 多模态大模型,该模型在单图像、多图像和视频任务中均展现出了卓越的性能。专为多模态大型模型设计的评估框架 LMMs-Eval 中显示,LLaVA-OneVision-72B 在大多数基准上优于 GPT-4V 和 GPT-4o,该教程已上线至 OpenBayes ,一键克隆即可启动

2024-10-15 17:57:30 751

原创 OpenBayes 教程上新丨打光神器 IC-Light 上线,光影效果高度一致,快速拯救废片

斯坦福博士张吕敏 (Lvmin Zhang) 开源了一款能够重塑光线的神器 IC-Light,用户可以通过简单的文本描述或背景条件来控制图像的光照效果,使得图像在视觉上与新的背景或环境融合得更加自然。目前「IC-Light 图片打光神器、背景自然融合替换」已上线至 OpenBayes 公共教程模块,一键克隆即可启动,分分钟帮你拯救假期废片。

2024-10-15 17:20:39 589

原创 OpenBayes 一周速览|IC-Light 图片打光神器一键启动!Tecnalia 电子设备废物高光谱数据集上线,提高电子废物回收准确性

这个模型特别适合创造具有经典卡通美学的异想天开和风格化的插图,其生成的图像具有手绘的质感、流畅的笔触,以及柔和的色彩。Tecnalia 高光谱数据集包含来自电机和电子设备废物 (WEEE) 的不同有色金属部分,如铜、黄铜、铝、不锈钢和白铜,图像在光谱范围 [415.05 纳米,1008.10 纳米] 内包含 76 个均匀分布的波长。该数据集记录了 10 名测试者在被试收听和想象音乐片段时记录的脑电图数据,其中包括 12 个音乐片段,每个音乐片段大约 7-16 秒且包括不同的音乐流派。

2024-09-23 20:00:58 696

原创 OpenBayes 教程上新|让虚拟偶像活起来!LivePortrait 实现超逼真表情迁移

LivePortrait 在最新版本中通过精确的画像编辑和视频编辑等功能,极大地简化了这一过程。创作者可以精确控制图像中的细微动作,生成高质量、细节丰富的动态视频,为创意和内容制作提供了极大的灵活性和便利。OpenBayes 的公共教程模块现已上线了「LivePortrait 最新版一键运行 Demo」,该教程已经为大家搭建好了环境,无需输入任何命令,一键克隆即可立即启动!

2024-09-23 19:49:13 531

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除