
AI大模型
文章平均质量分 91
RAG知识库、LangChain、人工智能(AI)大模型是指那些参数量巨大、功能强大的人工智能模型,通常用于自然语言处理(NLP)、计算机视觉(CV)、语音识别和生成等任务。这些模型通过深度学习算法训练而成,通常基于神经网络架构,如Transformer、BERT、GPT等。
MrJson-架构师
这个作者很懒,什么都没留下…
展开
-
阿里深夜开源推理模型QwQ-32B,性能比肩R1满血版
尤其是对于那些致力于打造专业级AI解决方案的小型企业或是初创团队而言,Qwen-32B无疑提供了一个极具吸引力的选择——它既具备强大的逻辑推理、数学处理以及编程能力,又保持了良好的可访问性和灵活性。我把这段代码粘贴到了Leetcode平台上,直接提交,没想到这段代码竟然完美的通过了全部测试用例吗,而且执行用时才127ms,击败了93%的在这个算法题库做尝试的人。最后的原因还是落在了Qwen团队的强化学习上。说实话,这个结果让我挺惊讶的,毕竟127ms的用时,看平均的用时基本都在1691ms左右。原创 2025-03-06 19:23:35 · 846 阅读 · 0 评论 -
大模型推理服务全景图
随着 DeepSeek R1 和 Qwen2.5-Max 的发布,国内大模型推理需求激增,性能提升的主战场将从训练转移到推理。由于无论是训练还是推理,如何提升性能都是业内讨论最多的话题之一。为什么是性能呢?在大模型消耗计算资源多、客户端内容流式生成的场景下,性能显得尤为重要。推理性能的提升涉及底层硬件、模型层,以及其他各个软件中间件层的相互协同,因此了解大模型技术架构的全局视角,有助于我们对推理性能的优化方案进行评估和选型。原创 2025-02-17 10:52:09 · 1028 阅读 · 0 评论