- 博客(99)
- 收藏
- 关注
原创 OpenCSG DataFlow:锻造大模型智慧的炼金术,开启数据集Agentic新范式
DataFlow 为用户提供高效、可靠的数据处理解决方案。
2024-09-29 14:47:03 759
原创 微软推出GRIN-MoE:开创专家路由新范式
微软最近推出的GRIN-MoE(Gradient-Informed Mixture-of-Experts)模型,以其独特的架构和显著的性能表现,正引领着AI技术的前沿,特别是在编码和数学任务上展现出强大的能力。GRIN-MoE模型是微软研究院开发的一种先进的人工智能模型,基于Transformer架构,结合了混合专家(Mixture-of-Experts, MoE)设计理念。在编码任务的HumanEval基准测试中,GRIN-MoE获得74.4的高分,超越了GPT-3.5-turbo等多个流行模型。
2024-09-27 14:13:15 577
原创 Llama 3.2:轻量级设计与多模态能力
该系列包括轻量级文本模型(1B 和 3B)以及视觉模型(11B 和 90B),专为在边缘和移动设备上的高效应用而设计。这些模型经过预训练和指令调优,特别适合于实时处理和个性化需求,能够在多种任务中展现出卓越的表现,包括文本生成、图像理解和数据摘要。该系列包含轻量级文本模型(1B 和 3B)和视觉模型(11B 和 90B),旨在支持在边缘和移动设备上的高效应用。: 11B 和 90B 模型在图像理解任务中取得了显著成绩,能够在复杂场景中进行准确推理,表现优于传统的封闭模型。扫描上方二维码添加传神小助手。
2024-09-27 14:12:16 512
原创 英伟达发布NVLM 1.0:屠榜多模态任务,纯文本性能逆势提升
英伟达最近推出了NVLM 1.0,这是一款多模态大型语言模型,在视觉-语言任务上表现出色,能够与最强的闭源模型(如GPT-4o)以及开源模型(如LLaMA 3-V 405B 和 InternVL 2)相媲美。值得关注的是,NVLM 1.0 不仅在多模态任务中表现优异,甚至在纯文本任务上也有所突破。经过多模态训练后,NVLM 1.0 在文本任务中的表现相比其基础语言模型(LLM)主干有明显提升,特别是在数学和代码生成基准测试中,平均准确率提高了 4.3 个百分点。
2024-09-26 13:33:53 507
原创 高效、精准、智能:GOT-OCR2.0引领OCR 2.0时代
GOT-OCR2.0 是阶跃星辰一款新一代的 OCR 模型,致力于解决传统 OCR 系统(OCR-1.0)和当前大规模视觉语言模型(LVLMs)在 OCR 任务中的局限性。作为一款开源模型,GOT-OCR2.0 不仅能够处理标准的文本识别任务,还可以应对复杂的光学字符识别需求,如公式、表格、乐谱、几何图形等复杂结构。通过端到端的统一架构设计,GOT-OCR2.0 实现了更高的精度、效率和适应性。来源:传神社区01 GOT-OCR2.0 的功能与优势。
2024-09-26 13:30:39 829
原创 传神论文中心|第26期人工智能领域论文推荐
传神社区注意到这篇文章中有以下亮点:这项研究为 LLM 的自我纠错提供了全新的解决方案,通过强化学习方法,模型可以在完全自生成数据的基础上进行自我改进。该研究提出的评估方法,不仅有助于比较模型的记忆能力,还为进一步优化模型的记忆和适应性提供了新的视角。传神社区注意到这篇文章中有以下亮点:Moshi 的创新语音-文本模型和全双工对话框架,结合 Helium 的强大语言能力与 Mimi 的顶尖音频性能,为语音交互技术带来了全新的突破。欢迎下载:https://huggingface.co/opencsg。
2024-09-26 13:28:13 598
原创 OpenCSG推出StarShip SecScan:AI驱动的软件安全革新
OpenCSG推出StarShip SecScan:AI驱动的软件安全革新
2024-09-24 10:55:27 841
原创 超越极限!Qwen2.5 助力多领域智能应用
能轻松应对复杂的数学问题。Qwen2.5-Math-72B-Instruct 的整体性能超越了 Qwen2-Math-72B-Instruct 和 GPT4-o,甚至是非常小的专业模型如 Qwen2.5-Math-1.5B-Instruct 也能在与大型语言模型的竞争中取得高度竞争力的表现。是专门为编程任务设计的,它经过 5.5T 编程相关数据的训练,即使是小规模模型(如 7B)也能在编码评估基准中超越许多大型模型,成为您理想的编程助手,无论是调试代码、解答编程问题,还是提供代码建议,它都能应对自如。
2024-09-21 20:10:14 1038
原创 年度巨献 | OpenCSG开源最大中文合成数据集Chinese Cosmopedia
提示生成是该项目的核心部分,为了确保生成的内容在不同主题和受众间保持多样性,开发团队设计了数百万条不同的 prompts,调整了生成文本的风格和目标受众。该模型通过强大的长文本生成能力,确保了生成数据的连贯性和内容深度。例如,对于教科书类型的内容,prompt会引导模型生成严谨且具有深度的学术文本,而对于故事类内容,则引导模型创造生动、引人入胜的情节。例如,种子数据来源于各类中文百科、知识问答和技术博客等,而prompt则用于生成具有不同受众和风格的内容,从学术教科书到儿童故事,内容广泛且具有针对性。
2024-09-21 20:06:48 612
原创 CSGHub开源版本v0.9.0更新
开放传神(OpenCSG)成立于2023年,是一家致力于大模型生态社区建设,汇集人工智能行业上下游企业链共同为大模型在垂直行业的应用提供解决方案和工具平台的公司。迁移 repo community 到 csghub server,支持 discussions,comments。git server增加gitaly的支持,且新版本默认使用 gitaly。新增资源控制台(包含finetunes,endpoints,以及资源列表)欢迎下载:https://huggingface.co/opencsg。
2024-09-21 20:03:20 428
原创 传神论文中心|第25期人工智能领域论文推荐
这一策略不仅优化了问题解决路径,还有效提升了最终答案的准确性。尤其值得关注的是,使用 Llama3-8b 模型在 GSM8K 数据集上实现了 21.05% 的性能提升,为未来在复杂推理任务中的应用提供了有力的理论支持和实践方案。传神社区注意到这篇文章中有以下亮点:该综述全面探讨了大语言模型代理在软件工程中的应用,从需求工程到测试生成,再到软件维护,提供了广泛的视角。这篇文章为研究者和从业者提供了一个全面的框架,展示了 LLM 在各个软件开发环节中的潜力,并为未来基于 AI 的软件开发工具的发展指明了方向。
2024-09-16 18:52:41 618
原创 Mistral AI再创新高,Pixtral 12B多模态模型强势来袭
相比 Qwen2-VL-7B、LLaVA-OV-7B 和 Phi-3 Vision 等同类模型,Pixtral 12B 在多模态推理、问答系统、图像理解等任务上均表现优异,尤其是在图像生成和高级图像处理任务上处于领先地位。作为一款具有语言与视觉处理能力的模型,Pixtral 12B 支持高达1024×1024像素的图像,具备强大的文本生成、图像理解与生成能力,能够处理复杂的文本与图像任务,在OCR、图像分类、问答系统等场景表现出色。欢迎下载:https://huggingface.co/opencsg。
2024-09-16 18:49:28 767
原创 CodeSouler v1.0.7 版本更新
通过该功能,开发者可以在编写代码时只需点击一下,就能自动生成详细的文档注释,极大地提高了开发效率,避免了手动编写注释的繁琐操作。通过这项功能,用户可以快速为代码中的每一行添加清晰的注释,确保代码逻辑对团队成员和未来的维护者更加易于理解。通过这项功能,开发者能够快速识别并自动修复代码中的潜在问题或不良代码结构,从而提升代码的可维护性和性能。通过这一功能,开发者可以将代码片段直接发送到聊天窗口,随后系统会自动进行代码审查,分析代码的质量并提出优化建议。这为团队合作、代码审查以及学习新技术提供了极大的便利。
2024-09-12 10:29:14 332
原创 小而强大!零一万物 Yi-Coder 模型震撼发布!
结果表明,在开源代码大语言模型中,Yi-Coder-9B-Chat 取得了优异的成绩,在 Primary 和 Plus 两个子集中始终优于 DeepSeek-Coder-33B-Instruct 和 CodeQwen1.5-7B-Chat。:在 HumanEval 和 MBPP 等流行的代码生成和推理任务中,Yi-Coder-9B-Chat 也表现突出,分别达到了 85.4% 和 73.8% 的通过率,并且是首个在 CRUXEval-O 基准测试中通过率超过 50% 的开源模型。
2024-09-09 22:21:51 365
原创 国产“小钢炮”MiniCPM3-4B:小参数,大能量!
在工具调用能力的评测中,MiniCPM3-4B 在 BFCL(Berkeley Function Calling Leaderboard)上的得分高达 76.0%,领先于 Qwen2-7B-Instruct(71.6%) 和 GLM-4-9B-Chat(70.1%) 等多个更大参数模型,表现出超强的工具调用能力。与部分 7B、9B 参数的大模型相比,MiniCPM3-4B 的性能表现显著更好,尤其是在中文能力、数学能力等任务中优势明显。随着版本迭代,模型层数逐步增加,提升了模型的复杂性与推理能力。
2024-09-09 22:16:15 981
原创 国内独家首发 | OpenCSG开源中文版fineweb edu数据集
这些数据涵盖了从2013年至2024年的网页内容,通过精心设计的处理流程,FineWeb提供了丰富且多样的高质量语料资源,为训练更强大、更精确的语言模型提供了高质量数据。通过实验结果可以发现,在训练的靠后阶段,可能是由于进入了第2个epoch,且学习率进入快速下降阶段,训练的效果开始逐渐涌现,此时,使用chinese-fineweb-edu训练的模型,准确率有了明显的上升,而使用随机抽取的数据训练,则一直处于较低水平。这种数据整合方式确保了模型在面对多样化的教育场景时,能够保持卓越的表现和高质量的输出。
2024-09-04 21:18:06 940
原创 传神论文中心|第24期人工智能领域论文推荐
通过多代理架构的设计,这一框架能够高效地整合各个子代理的专长,利用历史数据中的模式和趋势,显著提升了新数据的预测能力。其基于调优的小型语言模型的灵活性和精确性,为时间序列任务的处理提供了强大的支持,展现了未来在数据分析领域的广阔应用前景。传神社区注意到这篇文章中有以下亮点:Smaller, Weaker, Yet Better 提出了一个具有颠覆性意义的观点:在生成用于微调的合成数据时,较弱且成本更低的模型能够胜过更强大且昂贵的模型。这一成果为多模态模型的训练开辟了新路径,有望推动跨模态领域的发展。
2024-09-04 21:09:33 644
原创 突破视觉理解极限,Qwen2-VL重磅登场
在六个关键指标上,Qwen2-VL展现了卓越的视觉能力,包括综合的大学题目、数学能力、文档表格多语言文字图像的理解、通用场景下的问答、视频理解及智能代理功能。Qwen团队以Apache 2.0协议开源了Qwen2-VL-2B和Qwen2-VL-7B,同时发布了Qwen2-VL-72B的API。解决Qwen2-VL的数学与编程能力得到了显著增强。Qwen2-VL扩展了视频内容分析的能力,能够总结视频要点、即时回答相关问题,并维持连贯的对话,仿佛一位随时待命的个人助手,为用户提供更加直观且即时的帮助。
2024-09-04 21:06:50 970
原创 StarShip v0.5版本更新
开放传神(OpenCSG)成立于2023年,是一家致力于大模型生态社区建设,汇集人工智能行业上下游企业链共同为大模型在垂直行业的应用提供解决方案和工具平台的公司。修复因一次性chunk代码块数量过大导致的embeddings失败,并引入重试机制。自动检索相关代码片段并高亮显示,兼容VS Code和JetBrains平台。优化代码补全机制,调整触发逻辑并改进防抖算法,减少编码干扰。默认审查GitDiff,优化CodeReview指令体验。支持审查风格、审查语言、检查工具和代码审查规则的配置。
2024-08-30 19:54:17 335
原创 国产开源Sora:CogVideoX-5B重磅开源,提升视频生成新高度!
为了改善视频与文本的对齐,CogVideoX-5B采用了专家自适应LayerNorm技术,这一技术能够更好地融合视觉和语义信息,特别是在处理大幅度运动的场景时,模型能够保持较高的一致性和稳定性。:在训练过程中,模型采用了分辨率渐进训练技术,从低分辨率视频开始,逐步提高分辨率,最终达到高质量的视频生成效果。:CogVideoX-5B在单卡RTX 3060显卡上就能顺畅运行,这意味着更多的用户,无论是学术研究者还是中小型企业,都能以相对低廉的硬件成本,体验到顶尖的AI视频生成技术。
2024-08-28 15:49:26 585
原创 AI21 Labs 发布全球首批生产级 Mamba 模型:Jamba 1.5 系列重磅登场
在全球人工智能领域,AI21 Labs 再次走在前沿,正式推出了 Jamba 1.5 系列开放模型,包括 Jamba 1.5 Mini 和 Jamba 1.5 Large。这些模型凭借创新的 SSM-Transformer 架构,在长上下文处理、速度和质量方面设立了新标杆,是非 Transformer 架构模型首次成功达到市场领先模型的质量和性能。来源:传神社区。
2024-08-28 15:35:51 646
原创 传神论文中心|第23期人工智能领域论文推荐
传神社区注意到这篇文章中有以下亮点:本文深入探讨了表格数据的语言建模技术,系统分类了表格数据结构和数据类型,并详细介绍了模型训练和评估所用的数据集、建模技术、训练目标、以及数据处理方法。传神社区注意到这篇文章中有以下亮点:本文深入探讨了大语言模型实践中的关键挑战,并通过对基础设施、软件架构、数据、应用和脑科学等主题的系统分类,提供了精辟的解答。传神社区注意到这篇文章中有以下亮点:本文提出了一种创新的两阶段提示技术,通过识别并过滤上下文中的无关信息,显著增强了大语言模型的鲁棒性。
2024-08-28 15:33:23 932
原创 OpenCSG全网首发!Phi-3.5 Mini Instruct全参微调中文版
🔍 本次发布的Phi-3.5-mini-instruct中文版模型基于最新的Phi-3.5架构,经过全参数微调,专为中文场景优化而设计。生成的文本不仅流畅自然,而且对语义的理解非常精准。Phi-3.5-mini-instruct模型支持128K的token上下文长度,并经过了监督微调、近端策略优化(PPO)和直接偏好优化(DPO),确保了指令执行的精确性和模型的安全性。为了评估Phi-3.5-mini-instruct模型在中文语境下的表现,我们对微调后的中文版和未经过微调的原始版本进行了详细对比。
2024-08-24 14:01:18 986
原创 微软Phi-3.5系列亮相:性能超越Gemini 1.5和GPT-4o
相比之下,其他更大参数的模型,如Llama 3.1-8B Instruct和Mistral-7B Instruct,在处理类似任务时往往需要更多的计算资源和时间,而Phi-3.5系列则以其精简的设计和高效的架构取得了更高的性价比。拥有420亿活跃参数的Phi-3.5 MoE模型在代码、数学和多语言理解方面表现出色,通常在基准测试中超越了更大的模型,如在5-shot MMLU基准测试中,这款模型在STEM、人文学科、社会科学等多个学科的不同层次上超越了GPT-4o mini。•Huggingface主页。
2024-08-22 10:25:47 675
原创 揭秘GPT-5,探索未来人工智能的无限可能
在过去的几年里,人工智能领域的快速发展引发了全球范围内的广泛关注和讨论。作为这一浪潮的先锋,OpenAI 推出的 GPT 系列模型已经成为了生成式人工智能的代名词。随着 GPT-4 的发布,它在各种任务中表现出的强大能力进一步巩固了其在行业中的领导地位。然而,随着技术的进步和竞争的加剧,AI 的未来将走向何方?GPT-5 是否会成为下一代人工智能的里程碑?本篇文章将探讨 GPT 系列模型的发展历程,分析 GPT-5 可能带来的技术突破,以及人工智能在多模态性、个性化和代理能力等领域的未来趋势。
2024-08-21 10:08:25 1230
原创 传神论文中心|第22期人工智能领域论文推荐
此外,它还使用一个自动化审稿人来评估生成的论文,声称在评估论文评分方面接近人类的表现,并声称生成的论文可以超过其自动化审稿人所判断的顶级机器学习会议的接受门槛。传神社区注意到这篇文章中有以下亮点:《Scaling LLM Test-Time Compute Optimally》深入探讨了大语言模型在推理阶段的计算扩展行为,并提出了一种自适应的计算最优策略。该框架通过图形化表示医学实体和知识,创建了一个全球互联的知识图谱,显著提升了结果的精确性,并在多个医疗问答基准上超越了现有的最先进模型。
2024-08-21 10:05:57 583
原创 CodeSouler v1.0.5版本正式发布
开放传神(OpenCSG)成立于2023年,是一家致力于大模型生态社区建设,汇集人工智能行业上下游企业链共同为大模型在垂直行业的应用提供解决方案和工具平台的公司。增强了vscode和jetbrains的代码补全功能,优化用户最近操作行为的适应性。欢迎下载:https://huggingface.co/opencsg。欢迎🌟:https:// github.com/OpenCSGs。•贡献代码,与我们一同共建更好的OpenCSG。更新了插件的使用文档,提供更详细的指南。•加入我们的用户交流群,分享经验。
2024-08-19 12:10:44 349
原创 CSGHub开源版本v0.8.0更新
开放传神(OpenCSG)成立于2023年,是一家致力于大模型生态社区建设,汇集人工智能行业上下游企业链共同为大模型在垂直行业的应用提供解决方案和工具平台的公司。欢迎下载:https://huggingface.co/opencsg。欢迎🌟:https:// github.com/OpenCSGs。CSGHub开源版本v0.8.0更新现已发布!•贡献代码,与我们一同共建更好的OpenCSG。支持模型体验的serverless API。•加入我们的用户交流群,分享经验。License解读功能上线。
2024-08-19 10:51:32 244
原创 英伟达开源 Nemotron-4-4B:小型模型,大能量
这款模型不仅具备出色的语言理解能力,还大大减少了计算资源和训练数据的需求,成为开发者在资源有限的环境中进行高效AI应用的理想选择。为了应对这一挑战,全球AI领导者英伟达(NVIDIA)近日开源了其最新的小型语言模型 Nemotron-4-Minitron-4B-Base。通过让“学生模型”模仿“教师模型”的行为,英伟达团队在极少量训练数据的情况下,显著提升了剪枝模型的表现。Nemotron-4-Minitron-4B-Base 模型的成功,离不开英伟达在模型压缩和优化领域的创新技术:结构化剪枝和知识蒸馏。
2024-08-19 09:40:09 609
原创 EXAONE 3.0:LG AI研究院发布全球领先的双语生成模型
最终,7.8B模型的推理处理时间较EXAONE 2.0减少了56%,成本降低了72%,并将总成本降至最初发布的EXAONE 1.0的6%。与同类模型相比,EXAONE 3.0不仅在英语和韩语的多项基准测试中斩获头筹,更通过其高效的模型架构和经济可行性的优化,为AI研究和应用打开了新的局面。在韩语的性能评估中,使用了两个基准测试来检查其在真实用例中的表现,并配置了多个基准测试来评估模型的整体表现。此外,EXAONE 7.8B在数学和编码的基准测试中表现优异,显示出其在推理方面的强大能力,超越了其他同类模型。
2024-08-19 00:48:19 499
原创 引领端侧多模态新时代:MiniCPM-V 2.6重磅登场
让模型解释下面两张图背后的小故事,MiniCPM-V 2.6 能够通过 OCR 精准识别到两张图片上的文字:“WFH Employees 8:59 AM”和 “WFH Employees 9:00 AM”,推理出“WFH”居家办公状态,然后结合两张图片的视觉信息联合推理出“工作在家时,8:59还在床上睡觉,9点立马出现在视频会议上”的居家办公的“抓狂”状态,尽显梗图的槽点和幽默,可谓是多图联合理解和 OCR 能力的强强结合。然而,MiniCPM-V 2.6通过对模型结构和算法的优化,成功实现了这一功能。
2024-08-14 10:57:04 696
原创 传神论文中心|第21期人工智能领域论文推荐
传神社区注意到这篇文章中有以下亮点:SAM 2 是一个开放统一的模型,专注于图像和视频中的实时物体分割,并且可以在未见过的视觉内容上应用而无需定制调整。传神社区注意到这篇文章中有以下亮点:如果您对Transformer模型的内部机制感兴趣,或者希望通过实验更好地理解这些模型的工作原理,Transformer Explainer 是一个值得推荐的工具。传神社区注意到这篇文章中有以下亮点:如果您对软件工程中的最新技术进展感兴趣,特别是基于大语言模型的应用,这篇综述论文是一个不可错过的资源。
2024-08-14 10:53:18 432
原创 智谱AI正式开源CogVideoX:视频生成技术的新里程碑
最新开源的CogVideoX-2B模型以其强大的生成能力和较低的资源需求,为视频生成领域注入了新的活力,它在FP-16精度下的推理仅需18GB显存,微调则只需要40GB显存,这意味着单张4090显卡即可进行推理,而单张A6000显卡即可完成微调。通过video-llama训练的过滤器,标注并筛选了20,000个视频数据点,同时计算光流和美学分数,动态调整阈值,确保生成视频的质量。CogVideoX-2B的提示词上限为226个token,视频长度为6秒,帧率为8帧/秒,视频分辨率为720*480。
2024-08-07 13:54:07 934
原创 OpenCSG首发中文Chinese Mistral Large 2!
为了更好地服务于中文用户,我们在mistral-large-instruct-2407的基础上进行了大量中文语料的微调,最终推出了CSG-Wukong-Chinese-Mistral-Large2-123B。通过对比,我们可以明显看出,CSG-Wukong-Chinese-Mistral-Large2-123B在对话生成的流畅性、语义理解的准确性和上下文关联性方面均优于Llama3.1-405B中文版。通过本次微调,mistral-large-instruct-2407模型的中文能力得到了显著提升。
2024-08-05 11:22:39 970
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人