- 博客(1105)
- 收藏
- 关注

原创 5 分钟用满血 DeepSeek R1 搭建个人 AI 知识库(含本地部署)
看到这里,相信你已经找到最适合自己的 DeepSeek 个人知识库方案了。如果你和大多数人一样,选择使用官方 API ,那就不用再为性能和本地硬件资源发愁;如果你恰好有充足的算力和技术储备,本地部署也是个不错的选择。不过,在整个过程中,我想和你分享的不仅仅是这些技术细节。而是一个中国团队能做出世界级大模型,一个需要 +86 才能注册的大模型。很庆幸,我们能作为中国 AI 技术进步的见证人。当然,暂时的领先不是终点。但 DeepSeek 给我们带来的,是“中国也可以”这份信心。
2025-02-05 16:07:16
8949
2

原创 2024年国内外最新AI大模型汇总(含ChatGPT、Claude、Kimi、文心、天工、讯飞、通义等10大主流AI大模型)
两年前,我和你谈论AI搜索时,你可能觉得我在做梦。但现在,梦想已经成真——信息搜索,知识工作者的新武器正如鲁迅先生所说:“输入的是垃圾,输出的也是垃圾。”在这个信息爆炸的时代,搜索能力成为了衡量知识工作者能力的关键。AI搜索的崛起AI搜索作为AI领域的热门赛道,正吸引着各路英雄豪杰。搜索引擎的两大类别:就像是我们的_私人助理,随时待命_,通过对话就能理解我们的需求,提供精准搜索结果。比如chatgpt、kimi、万知等。:这类搜索引擎则将AI技术融入搜索过程,让搜索结果更个性化、多样化。
2024-09-19 17:26:48
26348

原创 用国产长文本大模型写小说,这个太强悍了 !
GLM-4-Long是智谱 BigModel开放平台(bigmodel.cn)推出的一款先进语言模型,适用于需要大规模文本生成的应用场景。GLM-4-Long有很多的实际应用场景:比如说,解读企业年报、学习论文文献、公司财务报表、阅读长篇小说甚至是分析总结长视频。关键是价格非常亲民,100万 tokens 只需1元 ,这简直是白给了,良心定价!2。
2024-09-16 18:00:00
6707
原创 什么是Agent,一文彻底搞懂Agent!
AI Agent(人工智能代理)是一种能够感知环境、自主决策并执行动作的智能实体。与传统AI系统不同,Agent不仅能回答问题,还能主动完成一系列复杂任务。简单来说,如果把大语言模型(LLM)
2025-05-19 16:14:04
638
原创 中国移动云智算大会丨《云智算技术白皮书》业界首发(附30页PDF文件下载)
随着人工智能与算力网络深度融合,云计算已迈入智能化的新阶段。传统云服务体系面临哪些新的挑战?如何全面激活智能算力与应用普惠新势能?怎样推动云智算技术、产业、应用和生态成熟,为千行百业注智赋能?中国移动系统性定义了云智算体系架构,提出十大关键技术方向,为云智算发展探索了新的技术路径。近日,在2025中国移动云智算大会上,业界首份《云智算技术白皮书》(2025)发布,首次提出下一代云智算体系架构和十大关键技术方向,推动“云计算”向“云智算”升级,带领云计算产业技术革新。白皮书详细阐述了云智算的发展背景、内
2025-05-19 16:08:52
363
原创 PPT制作提速!DeepSeek五分钟搞定(附保姆级教程)
很多人还不知道DeepSeek的强大之处,今天我来教大家一个绝招!只需5分钟,就能学会用DeepSeek轻松制作出精美PPT! 今天山歌利用DeepSeek加Kimi制作PPT,这可以为普通人带来了诸多便利和优势。这一结合大大降低了制作PPT的门槛!
2025-05-16 15:06:54
895
原创 带你一步步搞定Qwen3模型的微调,推理、非推理一次搞定
Qwen3模型因其强大的性能和灵活的适配能力,近日来备受关注。它不仅支持多种规模的模型部署(从智能手机到大型集群),还引入了独特的混合推理模式,让你通过简单的参数调整就能切换推理能力。今天,我们将基于Unsloth工具,带你深入了解如何用自己的数据集微调Qwen3模型。本文会聚焦核心步骤,用通俗的语言把技术细节讲清楚,确保你能轻松上手。
2025-05-16 15:03:37
742
原创 「大模型学习黄金书单」认真啃完这些书,一条线速通大模型(附PDF)
说句实在的,很多人以为学大模型就是搞点提示词、调个 API,就能搞定一切。但真想“弄懂它”,甚至“做出点东西”来,不啃几本靠谱的书,真的不行。我一开始也是刷了一堆教程,收藏了几十个 AI 工具帖,但一到自己动手就抓瞎。直到我静下心认真啃完这些书,才发现——原来很多问题,书里早就帮你解答了。这几本书是一路上踩坑总结的「大模型学习黄金书单」,从编程入门,到深度学习基础,再到 LLM 原理、落地应用,完整一条线,不忽悠、不烧香,适合想认真搞事的朋友!
2025-05-15 15:11:10
927
原创 全球首个通用型 Agent!Manus:行业全解析 (附相关标的)
AI Agent(人工智能体)是一种能够自主感知周遭环境、进行独立决策和执行动作的智能实体。不同于传统的人工智能,AI Agent具备通过独立思考、调用工具去逐步完成给定目标的能力。类似于你的私人助理。AI Agent和传统大模型LLM的区别:大模型与人类之间的交互是基于prompt实现的,用户prompt是否清晰明确会影响大模型回答的效果,而AI Agent的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。
2025-05-15 15:05:10
661
原创 RAG 是什么?一文带你看懂 AI 的“外挂知识库”
1、 RAG 是什么RAG(Retrieval Augmented Generation,检索增强生成)是一种结合信息检索和文本生成的技术方案RAG 技术就像给 AI 装上了「实时百科大脑」,通过先查资料后回答的机制,让 AI 摆脱传统模型的”知识遗忘”困境
2025-05-14 14:53:34
865
原创 一份写给普通人的 DeepSeek 速成指南!快收藏
在2025年春节期间,一款源自杭州的AI产品DeepSeek崭露头角,迅速吸引全球目光。它如划破夜幕的璀璨流星,不仅为人工智能领域注入新的活力,更在开源生态中展现出独特的东方智慧。随着DeepSeek热度飙升,越来越多用户开始探索这款AI工具的使用方法。那么,如何才能充分挖掘其潜力,让它发挥最大价值呢?想要用好DeepSeek,首先需要对它有深入的认识。它如同一位知识渊博的伙伴,但偶尔也会出现“思维跳跃”的情况:可能会虚构数据、错误关联信息,甚至输出逻辑合理却存在事实错误的内容。因此,在使用过程中
2025-05-14 14:49:31
1072
原创 AI Agent的概念、典型设计架构、演变方向及如何做好Agent
Manus爆火之后“通用Agent”这个概念开始频繁出现在大众视野中,很多人也说2025年是Agent元年。从Anthropic发布MCP到Google发布A2A,从Dify、Coze到Manus各种Agent领域相关技术和产品在近一段时间内层出不穷。 结合目前工作中在做的项目,参考了很多相关文献,整理成一篇博文,简单讲讲Agent是什么,怎么设计,演变历程以及如何做好Agent产品
2025-05-13 15:14:24
992
原创 对于初学者而言,怎样才能入门大语言模型(LLM)呢?
或许你曾与手机中的语音助手展开过交谈,又或是借助某个在线工具完成邮件初稿的撰写。这些其实都是人工智能(AI)悄然渗透进我们日常生活的缩影。然而,不妨大胆设想:倘若AI不再局限于被动回应,而是能够主动为你预订机票、梳理会议要点,甚至助力你管理项目……这样的场景是否充满吸引力?这便是我们即将踏入的全新领域——AI智能体的世界。在本章内容中,我们将深入剖析AI、大语言模型(LLM)以及AI智能体的内在奥秘,清晰阐释它们的本质内涵、实际应用价值,以及为何当下是学习构建AI智能体的黄金时期。无论你是毫无基础的新手
2025-05-13 15:07:35
1363
原创 北航:2025年工业大模型白皮书(工业大模型全拆解:技术、落地、生态)
《2025年工业大模型白皮书》通过新能源车、高端制造等典型案例,拆解了模型如何在生产、检测、预测、调度等环节中真正“干实事”。白皮书还对企业如何构建自己的工业大模型进行了详细说明,涵盖模型选型、数据治理、算力部署和产业协同等关键问题。这份《2025年工业大模型白皮书》长达145页,由北航与蚂蚁工厂联合发布,系统梳理了工业大模型的发展现状、技术特点和落地路径。不同于通用大模型,工业场景对精度、稳定性和实时性有着更高要求,模型训练也需要应对高噪声、小样本、多变量等复杂数据环境。白皮书通过新能源车、
2025-05-12 15:22:05
700
原创 Dify 实战教程 | 10分钟搭建你的 Chatflow(数据可视化助手)
本篇我们来聊聊如何使用 Dify 的 Chatflow(对话流程编排器),构建一个Excel 数据可视化助手。在此前的教程中,我们介绍了「聊天助手」和「Agent」构建助手的使用方式,本篇将介绍一种更可控、逻辑更清晰的构建方式——Chatflow 应用。
2025-05-12 15:20:02
1616
原创 AI大模型入门:不微调的大模型能用吗?
大模型(Large Language Models, LLMs)是指通过海量数据和巨大参数量(通常10亿以上)训练而成的深度学习模型,具有以下特征:规模效应:参数量达百亿至万亿级通用能力:无需特定训练即可完成多种任务涌现特性:规模突破阈值后出现意外能力多模态潜力:文本、图像、代码等跨模态处理
2025-05-10 14:28:36
1006
原创 【实战聚焦 AI 落地】大模型加速器 2.0:借助 ChatDoc、TextIn ParseX 及 ACGE 构建 RAG 知识库问答系统
随着大数据、云计算等新一代信息技术深度融入金融、制造、互联网等各个领域,企业正加速向数字化转型。在此过程中,内部信息管理的复杂性与日俱增,构建功能完备的知识库成为企业提升竞争力的关键路径。但在实际运营中,企业知识管理面临诸多困境:知识资源分散存储在不同部门的文件系统、员工个人电脑甚至纸质档案中,导致统一管理困难重重;各业务系统间数据壁垒森严,形成信息孤岛,严重阻碍跨部门协作与信息共享;此外,知识传承过度依赖核心员工的经验传授,缺乏标准化、体系化的沉淀机制,难以形成可持续的知识资产积累。
2025-05-10 14:25:42
880
原创 【大模型面试】理想汽车大模型算法工程师面试,被摁在地上摩擦。。。
自我介绍环节主要是让双方进入快速面试状态,这块没什么特别注意的,别磕巴就好,主要聊聊个人基本信息、教育背景、工作经历和技能特长等等。
2025-05-09 15:19:04
428
原创 医疗大模型爆发!一文读懂 LLMs 如何重塑医学未来
随着DeepSeek的爆火,大语言模型(LLMs)在医疗领域的开发与应用部署也正在悄无声息地 掀起一场医疗变革风暴!今天,分享发表在*Nat Rev Bioeng 上的最新. 我们深入聊聊 LLMs 在医学上的那些事儿,带你抢先了解未来医疗的新模样!
2025-05-08 14:43:38
1072
原创 零基础小白,三分钟入门智能体并学会用Coze搭建自己的第一个智能体(新手必看)
先引入一个定义:AI Agent 是指人工智能代理,是一种能够感知环境、进行自主理解、进行决策和执行动作的智能体。通俗点的话说就是能够理解描述并自主拆分任务,并完成任务执行的人工智能助手。比较典型的,《钢铁侠》中的贾维斯,就是Agent的终极代表,当然现在科技还达不到那种程度,不过我们可以先学习搭建一些简单的,用来给自己的工作提效,比如 自动总结会议内容,自动分析报告,闹钟提醒等等。
2025-05-08 14:40:43
883
原创 报告 | 清华大学《DeepSeek政务应用场景与解决方案(最新版)》(附下载)
DeepSeek政务应用场景及解决方案》聚焦政务数字化转型,阐述了DeepSeek在政务领域的多元应用、技术方案及发展建议,为提升政务服务效能提供创新思路。政务数字化转型历程:政务数字化历经电子政务、互联网+政务、AI+政务三阶段。从早期以“IT化”实现政务流程初步数字化,到“平台化”推动跨部门协同,再到如今“智能化”驱动决策与服务变革,不断升级。DeepSeek在政务场景的应用。
2025-05-07 14:34:24
1089
原创 一文读懂 RAGFlow:从 0 到 1 教你搭建 RAG 知识库
RAGFlow 是一款专注于检索增强生成技术落地的开源框架,旨在简化 RAG 系统的搭建与部署流程。它以模块化、可扩展的设计理念,整合了数据处理、检索、生成等多个核心环节,为开发者提供了一站式的 RAG 解决方案。通过 RAGFlow,用户无需深入复杂的底层技术细节,就能快速构建出适配不同业务场景的 RAG 知识库,实现基于大规模文本数据的智能问答、内容生成等功能。本文介绍了 RAGFlow 的基础使用方法,从演示效果来看尚可。然而,在实际应用场景中,各类文件格式与结构各不相同,文件解析成为一大难题。
2025-05-07 14:32:01
1111
原创 斯坦福《2025年人工智能指数报告》出炉!深度剖析全球AI竞争格局
2025年人工智能指数报告》揭示了AI发展的新常态:技术突破与治理需求同步加速。中美竞争呈现"双轨并行"态势——中国在基础研究规模与开源生态建设上持续发力,美国则在原创性突破与商业转化方面保持领先。值得关注的是,全球AI发展正从单纯的技术竞赛转向包含安全、产业融合在内的系统性竞争。随着各国监管框架快速成型,如何在创新激励与风险防控间取得平衡,将成为下一阶段的核心命题。报告数据表明,
2025-05-06 14:26:41
975
原创 新手入门AI大模型:从国内到国外,这一份清单就够了
AI大模型的快速发展为技术爱好者和从业者提供了广阔的机遇。通过本文的国内外模型清单、学习资源、工具平台及伦理指南,新手可以系统地开启学习与实践。建议从基础理论入手,结合实际项目,持续关注行业动态,逐步成长为AI大模型领域的专家。未来,随着技术的不断演进,负责任地应用AI将成为推动社会进步的关键。
2025-05-06 14:18:03
1394
原创 RAG大模型增强生成能力案例有哪些?
我们经常把大模型比作一个大学生。相当于面试的时候问大学生”你是如何看xx公司的?相当于对已经入职的大学生说“去我们公司的资料库里查查,出一个关于这个公司的调研报告”“查阅资料库”就相当于是RAG,全称是Retrieval Argumented Generation — 检索增强生成。把检索(资料库)的结果发给大模型,以增强大模型的生成能力。说实话RAG入门很容易,我的开发伙伴(公众号AI小智)在带病情况下,大概用了一个周末完成coding。不过要想做好可不容易。
2025-05-05 15:20:28
946
原创 2025年AI大模型教育行业白皮书-32页(附下载)
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。所以我综合了大模型的所有知识点,给大家带来一套。我们这套大模型资料呢,会从。
2025-05-05 15:04:15
401
原创 【一文说清】大模型:蒸馏、微调、RAG,超级简单!通俗易懂,0基础小白也能看懂!
想象一下,一个知识渊博的大学教授(大模型)和一个天真无邪的小学生(小模型)。教授啥都会,但请他来上课很贵,教室得配超级电脑,电费也高得吓人。小学生虽然啥都不会,但养起来便宜,一台普通笔记本就能跑。怎么办呢?我们让教授把自己的“解题技巧”浓缩一下,教给小学生,虽然不能让小学生变得和教授一样牛,但至少能学会几招,能应付日常问题。这就是模型蒸馏。学习AI大模型是一项系统工程,需要时间和持续的努力。但随着技术的发展和在线资源的丰富,零基础的小白也有很好的机会逐步学习和掌握。给教授一个问题(比如“这是猫还是狗。
2025-05-04 11:00:00
1420
原创 2025央国企AI+数智化转型研究报告
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。所以我综合了大模型的所有知识点,给大家带来一套。我们这套大模型资料呢,会从。
2025-05-04 10:15:00
295
原创 一文搞懂:RAG、Agent与多模态的行业实践与未来趋势
首先:计划、需求分析、框架设计、系统方案、编码实现、功能性测试,最后是产品交付。接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。
2025-05-03 12:00:00
998
原创 信通院:“机器人+人工智能”工业应用研究报告 2025
报告由中国信通院江苏研究院和苏州市机器人产业协会等单位编写。报告分析了 “机器人 + 人工智能” 在工业领域的应用情况,探讨其发展背景、技术趋势、应用现状,并对未来进行了展望,还列举了苏州市相关应用案例。研究背景:大模型推动机器人向通用化发展,软硬件协同提供算力支持。各国纷纷布局相关产业,中国也出台多项政策促进二者融合。工业领域因环境特点成为智能机器人应用落地的主战场,中国工业机器人市场规模大,但在核心技术方面仍需提升。
2025-05-03 09:45:00
677
原创 浙江大学:大小模型端云协同赋能人机交互 2025
本文围绕大小模型端云协同赋能人机交互展开,介绍了相关背景、技术、应用及研究成果,具体如下:研究背景:随着 AI 发展,大模型带来变革,英伟达黄仁勋提出 “人工智能的 iPhone 时刻”。移动端设备计算能力增强,但面临算力、带宽和电量限制,云智能也存在推理响应延时高、模型更新周期长等局限,端云协同成为趋势。
2025-05-02 09:00:00
304
原创 美国斯坦福大学《2025年人工智能指数告》解读
斯坦福报告揭示了AI技术快速迭代与全球竞争的复杂图景:性能趋近但生态差距犹存,成本下降推动普惠化,但监管、伦理和基础研究仍是关键挑战。中国在应用和专利上表现突出,但需警惕“应用强、生态弱”的潜在风险;美国则持续领跑创新与投资,开源技术正在重塑行业格局。未来,AI的可持续发展需平衡技术突破、社会信任和全球协作。
2025-05-01 08:15:00
836
原创 MARFT:大模型多智能体强化微调范式来啦!
该论文详细介绍了 MARFT 的核心实现,强调了其模块化和适应性,并提供了完整的开源代码,以促进采用和进一步研究,具体见如下论文与代码链接。
2025-04-30 22:25:36
641
原创 【综述:入门必读】RAG演变到MRAG的三个阶段
生成方面为了解决上述问题,MRAG2.0 通过文档解析和索引保留多模态数据,同时引入了多模态检索和多模态大语言模型进行答案生成,真正进入了多模态时代。通过利用多模态大语言模型 (MLLM) 的能力,生成模块现在可以直接处理多模态数据,最大限度地减少数据转换过程中的信息丢失。
2025-04-30 11:59:21
575
原创 清华大学:郑纬民教授在全球软件开发大会技术分享,《关于人工智能大模型的几点思考》
郑纬民教授于2025年在QCon全球软件开发大会上发表了题为《关于人工智能大模型的几点思考》的主题报告。在这份报告中,郑教授深入分析了人工智能大模型的技术演进方向、所面临的核心挑战,以及在国内环境下的应用实践。他的分享为业界从学术研究到实际工程应用提供了宝贵的见解与指导。
2025-04-29 14:58:58
362
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人