自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(757)
  • 收藏
  • 关注

原创 小而强大,阿里开源全球最强开源模型 Qwen3!

小而强大,阿里开源全球最强开源模型 Qwen3!

2025-05-02 10:30:00 311

原创 阿里 Qwen3 开源了,这次有点猛!

嘿,听说了吗?前阵子著名 AI 科学家李飞飞所在团队(Stanford HAI)最新发布的《2025 年人工智能指数报告》里,阿里表现挺抢眼,有 6 款模型入选了「值得关注的 AI 模型」位列全球第三。这背后,是阿里多年来选择开源、技术积累的硬实力。

2025-05-01 08:00:00 300

原创 MCP:编程实战,基于 SSE 传输方式的客户端编码实现

本文是 MCP (模型上下文协议)系列的第四篇文章。上文介绍了 MCP 服务端的服务类型与编程实现。

2025-04-30 09:49:39 512

原创 Ollama本地部署运行全球最强开源大模型 Qwen3

Qwen3是阿里云最新推出的开源大语言模型系列,代表着目前全球顶尖的开源AI技术水平。作为Qwen系列的最新成员,这一模型在代码、数学、通用能力等多个基准测试中与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型相比展现出极具竞争力的表现。

2025-04-30 09:47:56 778

原创 阿里Qwen3深夜开源!8款模型、集成MCP,性能超DeepSeek-R1,2小时狂揽16.9k星

阿里Qwen3深夜开源!8款模型、集成MCP,性能超DeepSeek-R1,2小时狂揽16.9k星

2025-04-29 10:34:48 937

原创 通义千问Qwen3,开源!

我们相信,Qwen3 的发布和开源将极大地推动大型基础模型的研究与开发。我们的目标是为全球的研究人员、开发者和组织赋能,帮助他们利用这些前沿模型构建创新解决方案。

2025-04-29 10:25:29 630

原创 一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory

一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory

2025-04-29 09:33:51 647

原创 小模型干大事情,基于LLaMA-Factory+Lora入门级微调开源AI模型

训练完成后,微调后的模型将保存在输出目录里,使用时直接在检查点路径里选择,文件命名是以当时训练的时间来命名。在预训练模型的基础上,使用特定任务的数据对模型进行进一步训练,以适应新的任务。

2025-04-29 09:29:27 888

原创 GitHub 1.4K Star 项目 | Rowboat:AI 多智能体工作流构建神器

A2A 只公布以来还没有看到对应的项目,一个多智能体协同项目——Rowboat,这个项目虽然不是支持A2A 协议,但是对于普通的工具,以及MCP 都是相互支持,以MCP + 工具的形式相互结合。

2025-04-28 09:50:14 807

原创 Transformer Lab:100%本地运行的LLM工作站,开箱即用的全能选手!

Transformer Lab:100%本地运行的LLM工作站,开箱即用的全能选手!

2025-04-28 09:46:15 706

原创 大模型新书丨肖仰华教授力作《大模型浪潮》重磅来袭

《大模型浪潮:从ChatGPT 到DeepSeek》一书中的内容就如同在大模型浪潮中被激起的朵朵思想浪花,作为智能时代大幕开启的序曲,向这个伟大时代致敬。

2025-04-27 10:22:25 612

原创 复旦NLP团队2025新书《大规模语言模型:从理论到实践(第2版)》重磅来袭!

各位读者朋友们,相信你一定还记得,在各大平台AI大模型图书推荐榜单中,一书始终位居排行榜前列,在2023年末那个时间点,这本书是少有的把大模型相关技术系统汇总整理,既有理论又有实践的。时隔不到两年,大语言模型领域的发展可谓突飞猛进,大语言模型的能力在多个方面实现了显著突破,在推理能力、上下文理解深度及多模态处理能力等方面取得了长足进步。

2025-04-27 10:18:39 675

原创 程序员必备:使用Cursor+MCP 提高开发效率+避坑指南

AI正在深刻改变着软件开发的方式。在传统的开发模式中,程序员需要记忆大量的语法规则、API文档和最佳实践,这不仅增加了学习成本,还限制了开发效率。

2025-04-25 09:20:33 876

原创 从零到一构建Agent系统:四大模块 + 框架生态详解

在大模型持续进化的今天,Agent 成为很多人眼中的“超级助手”,从代码编写到数据分析、从网页问答到知识检索,它无所不能。但如果你尝试亲自“造一个Agent”

2025-04-25 09:19:20 812

原创 NodeRAG:以图结构革新检索增强生成

在众多RAG方法中,NodeRAG以其独特的图结构框架脱颖而出。NodeRAG通过异构图结构和先进的检索机制,为LLM提供更精准、更高效的外部知识支持。本文将深入介绍NodeRAG的核心特性、优势及其在多个领域的卓越表现。

2025-04-24 09:43:35 636

原创 RAG 作者:RAG 已死,RAG 万岁!

每隔几个月,人工智能领域就会经历类似的模式。一个具有更大上下文窗口的新模型问世,社交媒体上便会充斥着“RAG 已死”的宣言。Meta 最近的突破再次引发了这场讨论——Llama 4 Scout 惊人的 1000 万(理论上)token 上下文窗口代表着一次真正的飞跃。

2025-04-24 09:30:48 583

原创 大模型是怎么“思考”的?五分钟看懂大模型的底层逻辑!

近年来,ChatGPT 的爆火让“大语言模型”(LLM)走进了大众视野。我们每天都在用它们聊天、写作、写代码,但你是否真正了解它们是怎么工作的?本文系统梳理了大语言模型的原理、训练方式及其实际应用。

2025-04-23 09:25:40 633

原创 在CPU上运行100B模型只需4MB内存!微软BitNet掀了英伟达的桌子!

在CPU上运行100B模型只需4MB内存!微软BitNet掀了英伟达的桌子!

2025-04-23 09:23:59 776

原创 大模型开发:掌握LLM的关键技能,这本指南不可错过(附PDF)

《Hands-On Large Language Models》(中文版预计 3 月底上市) ,由 Jay Alammar 和 Maarten Grootendorst 倾力打造,为你深入解读大模型的技术核心,让看似复杂的技术变得通俗易懂、触手可及!

2025-04-22 09:46:53 937

原创 混合专家模型 (MoE) 到底是什么?看完这篇,你也能讲明白!

如果你还不知道什么是 MoE ,那就码住今天的文章吧!我们将图解 MoE,用 50 张图细致地探索这一重要组件——混合专家模型(MoE)。

2025-04-22 09:40:06 1091

原创 这书太绝了!几乎把大模型讲得透透的!

一本注重实战、内容透彻的 LLM 入门书。作者手把手带你亲手构建、训练、微调一个属于自己的大模型。没有比这本书更保姆级的了。

2025-04-21 14:27:10 154

原创 权威力作升级!《大语言模型:从理论到实践》第二版(预览版)重磅来袭!

大家好!👋 在人工智能浪潮之巅,大语言模型(LLM)无疑是最耀眼的明星 ✨。从 ChatGPT 的惊艳问世,到 LLaMA、Qwen、DeepSeek 等模型的持续迭代,它们强大的语言理解、生成和推理能力正在深刻改变着我们的世界。

2025-04-21 14:01:24 1177

原创 FastGPT、Dify和Coze,三大智能体开发平台详细对比(附教程)

本文将从功能实现、用户体验、适用场景、以及性能表现等多个维度,深入分析这三款 RAG 工具的核心优势与潜在不足,为有需求的读者提供客观的参考建议,帮助大家选择最适合自己业务需求的解决方案。

2025-04-18 15:27:52 693

原创 「大模型学习黄金书单」认真啃完这些书,一条线速通大模型(附PDF)

这几本书是一路上踩坑总结的「大模型学习黄金书单」,从编程入门,到深度学习基础,再到 LLM 原理、落地应用,完整一条线,不忽悠、不烧香,适合想认真搞事的朋友!

2025-04-18 15:12:26 1221

原创 大模型书籍推荐:AI原生应用开发:提示工程原理与实战(附PDF)

《AI原生应用开发:提示工程原理与实战》是一本由人民邮电出版社权威出版,专门针对正在探索如何利用大模型做应用场景落地的人群,如研发工程师、产品经理、技术经理等。它站应用落地视角让你理解大模型是什么,能干什么,如何落地。

2025-04-17 11:09:27 819

原创 《大模型应用开发极简入门:基于GPT-4和ChatGPT》PDF下载

《大模型应用开发极简入门:基于GPT-4和ChatGPT》PDF下载

2025-04-17 10:39:02 590

原创 揭秘大模型的训练方法:使用PyTorch进行超大规模深度学习模型训练

我相信我们每个人都已经快要被 LLM(大语言模型)研究界的节奏“卷”麻了。几乎每天都会有一款新的 SOTA(最先进)模型横空出世,打破现有基准。

2025-04-17 10:32:22 803

原创 大模型书籍丨2025爆火全网的LLM大模型黑书!入门大模型大家全都在学~

今天给大家推荐一本4月份才新出的大型语言模型(LLM)的权威教程《基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理》!Google工程总监Antonio Gulli作序,一堆大佬推荐!这含金量不用多说,不多bb开始介绍!

2025-04-16 11:19:54 620

原创 AI大模型应用系列:从MLOps到LLMOps(附教程)

LLMOps 通过结合“终身”学习扩展了 MLOps,使机器学习模型能够随着时间的推移不断地从新数据中学习和改进,从而使数据快速变化的应用程序受益。

2025-04-16 11:18:39 838

原创 大模型教程丨GitHub16.6K星标,吴恩达的【大模型入门教程】究竟有什么魔力(附PDF)

今天给小伙伴们整理的这份大模型入门教程是由斯坦福大学的吴恩达老师和Open AI官方联合推出的大模型系列教程,从大模型时代开发者的基础技能出发,深入浅出地介绍了如何基于大模型 API、LangChain 架构快速开发结合大模型强大能力的应用。非常适用于开发者学习以开启基于 LLM 实际搭建应用程序之路。

2025-04-16 10:37:44 927

原创 大模型书籍分享丨《掌握大语言模型》附pdf书籍

《掌握大语言模型》这本书是自然语言处理(NLP)和大语言模型(LLMs)领域的一本重要参考书籍,适合那些希望深入了解和应用这些强大语言模型的朋友们。该书不仅仅是理论探讨,而是通过实际操作手把手教读者如何构建和应用这些强大的语言模型。

2025-04-15 10:30:38 808

原创 (中英双语)从零开始构建大模型:GitHub超44K Star的大模型教程(送PDF)

2025 年以来,AI 大模型领域持续火热,从 DeepSeek、GPT-4、Claude 3 到 Gemini 2.0 等等,各家模型参数动辄千亿级,能力日新月异。

2025-04-15 10:13:17 1261

原创 大模型新书丨从零开始构建大模型:GitHub超44K Star的大模型教程

对GPT大模型感兴趣的有福了!这本书的名字叫 《Build a Large Language Model (From Scratch)》 也就是 从零开始构建大语言模型!

2025-04-15 10:11:55 751

原创 LLM终极指南《LLM 应用开发实践笔记》PDF免费分享

大语言模型(Large Language Model)是一种基于深度学习技术的自然语言处理通用模型,它可以通过学习大规模文本数据的模式和规律,从而实现对自然语言的理解和生成。通用型:在广泛的任务中表现出色,而不是针对一项特定任务,规模大:参数数量在数十亿或更多数量级的深度学习模型。

2025-04-14 10:12:03 813

原创 使用KAG+多模态RAG+智能体建造强大的AI推理机器人

随着 AI 技术蓬勃发展,RAG 正成为游戏规则改变者,迅速成为问题解决和领域应用的合作伙伴,这正是 RAG 的独特之处。

2025-04-14 10:10:18 621

原创 一文讲透MCP的原理及实践

MCP (Model Context Protocol) 代表了 AI 与外部工具和数据交互的标准建立。通过本文,我们可以了解到MCP的本质、价值、使用与开发。

2025-04-14 10:05:23 904

原创 强烈推荐!这本大语言模型 “宝典” 带你从入门到精通(含301页完整PDF和8章完整课件下载)

在大语言模型(LLM)飞速发展的当下,想要深入了解却不知从何入手?别担心,《大规模语言模型:从理论到实践》这本书就是你的最佳指南!

2025-04-12 09:43:08 805

原创 大模型新书丨《大规模语言模型:从理论到实践》(附PDF)

大模型新书丨《大规模语言模型:从理论到实践》(附PDF)

2025-04-12 09:39:46 793

原创 6 个 GitHub 上狂飙的 AI 教程(附教程)

6 个 GitHub 上狂飙的 AI 教程(附教程)

2025-04-12 09:30:23 685

原创 斩获 3W 星!最近爆火的 MCP 一网打尽

arxiv-mcp-server 这个 MCP Server,专为 arXiv 学术论文库设计,允许 AI 模型通过编程接口搜索论文、下载内容并进行深度分析(如摘要提炼、方法评估和结果解读),同时支持本地存储以加速访问

2025-04-12 09:24:35 836

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除