- 博客(1045)
- 收藏
- 关注

原创 coze功能详解!AI保姆级入门教程!
本地文档包含三种:1、文本格式:word, pdf, txt2、表格格式:excel, csv3、照片类型以上传本地文档为例,上传后,选择自动分段与清洗,coze会自动对数据进行处理上传后,我们在bot或工作流中,就能使用该知识库。
2025-01-04 17:32:07
16439
2

原创 没钱买GPU!本地还想跑大模型的终极工具Ollama!
Ollama 是一个开源平台,它允许我们在本地机器上轻松设置和运行 LLM。它简化了下载、安装和与 LLM 交互的过程。至少应该有 8 GB内存 的 Intel i5处理器才能运行7B型号,如果需要运行13B 的型号CPU起码得至少需要16 GB 的是i5。以此类推32 GB 的 RAM 来运行 33B 型号。
2024-11-22 17:30:34
9825

原创 大模型训练(超全面!超详细!)收藏这一篇就够了!
大模型训练被分解成了预训练,监督调优,对齐等阶段。先看预训练,预训练,即Pre-training。预训练的目的是让模型学习语言的特性,主要是学习语言表达的流畅性和规则。至于具体的语言任务,比如对话,角色扮演,信息抽取,翻译,阅读理解,问答等,则需要放到监督调优。预训练是大模型的基础和核心,预训练阶段决定了模型的基础能力和上限。
2024-09-23 15:27:15
5245

原创 一键部署本地私人专属知识库,开源免费!可接入GPT-4、Llama 3、Gemma、Kimi等几十种大模型,零代码集成。
今天跟大家分享的内容是,如何在本地搭建自己的本地知识库问答系统MaxKB,与其他问答知识库相比,他真正做到了开箱即用,零代码集成,支持ChatGPT、百度千帆、Lama2、Lama3,通义千问等几十种大语言模型,操作界面简介,小白也能快速上手。【注意在正式搭建知识库问答系统之前,请确保你的Windows系统已经升级到了专业版本,同时拥有一张独立的显卡!!】
2024-06-13 17:24:12
5098
1

原创 AI大模型:国内外大模型发展情况梳理
随即引爆社交网络,大模型行业进入加速发展阶段。国外基础模型实力强劲、不断精 进,开源模型打造庞大应用生态,端侧模型小而美。国内大模型也进入加速成长期,在过去一年中取得了实质性突破。百度文心一言、 讯飞星火、清华智谱、商汤“日日新”整体表现逼近,开源模型快速进步,文生视频、文生音乐等多模态 也取得突破。国内大模型网页流量和应用下载量节节攀升,大模型已经成为日常生活中的重要助手。。国外大模型主要分为三个层级:性能强劲的闭源模型,具备生态优势的开源模 型,以及专注端侧应用的轻量模型。
2024-05-17 15:01:07
6792
1

原创 作为普通程序员,我们该如何学习大模型(LLM),学习路线和知识体系
原谅我的后知后觉,才开始从头写,我是已经上了一阶段大模型的课,也搜集了些资料,并自己做了小部分实践,回过头来,才想开始整理些文章。起初,大家都在写,都在发,我那会在焦虑。自chatgpt爆火以来,AI技术又被广泛关注,国内外各大厂商也纷纷布局,作为我们每一个普通人,也无不时刻感受着AI一波又一波的冲击。尤其是作为程序员的我,相信绝大多数程序员也有和我一样的感受,从一开始的新奇,到焦虑,到试图去了解他,到去尝试,并致力于应用。
2024-04-12 11:19:13
9290

原创 大模型部署工具 llama.cpp 介绍与安装使用
另外一个是量化,量化是通过牺牲模型参数的精度,来换取模型的推理速度。llama.cpp 提供了大模型量化的工具,可以将模型参数从 32 位浮点数转换为 16 位浮点数,甚至是 8、4 位整数。训练的过程,实际上就是在寻找模型参数,使得模型的损失函数最小化,推理结果最优化的过程。训练完成之后,模型的参数就固定了,这时候就可以使用模型进行推理,对外提供服务。大模型时代,企业对人才的需求变了,AIGC相关岗位人才难求,薪资持续走高,AI运营薪资平均值约。llama.cpp 提供了模型量化的工具。
2024-04-07 18:31:27
11050
原创 一文读懂什么是RAG,如何搭建多模态RAG降低大模型幻觉
大语言模型(LLM)能够执行各种自然语言任务,例如文本生成、语言翻译、文本摘要、问答等。然而,使用 LLM 的一个显著局限是 LLM 幻觉。幻觉是指由 LLM 生成的响应虽然看起来正确且一致,但实际并非完全准确的现象。如果您不是特定领域内的专家,很难发现 LLM 生成的回答是不准确的。本文将介绍一种减轻 LLM 幻觉的解决方案——检索增强生成(Retrieval-Augmented Generation,RAG)。我们将搭建一个结合了不同模态数据(文本和图像)的多模态 RAG 应用,以减轻 LLM
2025-05-19 15:56:21
715
原创 北大重磅发布!北大DeepSeek系列7:AI工具深度测评与选型指南 v1.0 谁与争锋
在当今数字化浪潮汹涌澎湃的的时代, AI 已经不再是一个遥远的概念,而是深刻地融入到我们工作和生活的方方面面。从智能语音助手的贴心服务,到图像识别技术的精准应用,再到自然语言处理领域的飞速发展, AI 正以前所未有的速度改变着世界。在这样的大背景下,企业和个人都在积极寻求优质的 AI 工具,希望能够在这场科技变革中抢占先机,提升自身竞争力。然而,面对市场上琳琅满目、种类繁多的 AI 工具,如何在众多选项中精准定位最适合自己的那款,成为了困扰许多企业和个人使用者的难题。选型不当,不仅可能导致资源的浪费,还
2025-05-19 15:48:41
365
原创 万字长文!详解10 种新的思维链CoT方法
链式思维(CoT)长期以来一直是人工智能领域最热门的技术之一,这得益于其有效性以及极具吸引力的核心理念:通过明确的中间推理步骤引导模型解决复杂问题。不过,通常研究人员会对原始的 CoT 方法进行改进,探索出一些技巧以进一步提升大型语言模型(LLM)的推理能力,这正是我们今天要讨论的内容。
2025-05-16 14:33:50
960
原创 清华大学后又一个宝藏指南!天津大学发布《深度解读DeepSeek:原理与效应》手册!(可下载指导手册和指南)
自清华大学新闻与传播学院团队编写《DeepSeek:从入门到精通》,该手册得到了广泛的关注和应用,体现了DeepSeek的强化潜力和在AI领域的创新突破,具有广泛的受众群体。近日,天津大学自然语言处理实验室熊德意教授也编写《DeepSeek的技术原理与效应》手册,从生成式AI的发展历程入手,回顾了自2014年以来的技术突破,重点介绍了DeepSeek V2至V3及R1的技术创新。强调了DeepSeek作为国产AI的代表,不仅在模型架构上进行了优化,还在推理能力、强化学习等方面取得了重大突破。
2025-05-16 14:23:55
565
原创 全网催更的大模型爆款书《从零构建大模型》,中文版来了!
大家好! 在 AI 浪潮席卷全球的今天,ChatGPT、Gemini 等大语言模型(LLM)展现出的惊人能力,让我们对人工智能的未来充满想象。你是否也曾惊叹于它们的智慧,同时又好奇这些庞大而复杂的模型背后,究竟隐藏着怎样的奥秘?🤔 你是否厌倦了仅仅作为 API 的使用者,渴望真正理解 LLM 的核心原理?🤔 你是否希望不仅能“用”模型,更能亲手搓一个模型?如果你的答案是肯定的,那么今天我们要介绍的这本书,绝对不容错过!
2025-05-15 14:56:55
826
原创 国产AI大模型:一文详解核心终端应用!
AI应用端是AI技术最终落地和产生价值的环节。在该环节中,AI技术应用于具体的业务场景,用于解决实际问题以及提升效率和服务质量。按照AI渗透程度不同,AI应用主要分为AI赋能传统业务、AI增值服务、AI新兴业务、AI端侧应用、AI原生应用几大类型。
2025-05-15 14:53:49
555
原创 DeepSeek全攻略:从零基础到精通的终极指南
Deep Seek是一款创新的智能搜索与分析平台,致力于通过先进的人工智能技术,帮助用户高效地从海量信息中提取关键信息。无论是数据挖掘、知识管理,还是市场分析,Deep Seek都能为您提供精准的搜索结果和深入的洞察力。今天,我们将带你深入了解这款工具,从入门到精通,掌握它的核心功能与使用技巧,开启高效智能工作的全新篇章。
2025-05-14 14:42:55
884
原创 25种RAG架构大揭秘:AI项目如何选型?
身处当下的AI浪潮之中,你是否曾设想过:要是AI能够每次都从海量的全球知识储备里,精准无误地提取出堪称完美的答案,将会带来怎样震撼的体验?检索增强生成(Retrieval-Augmented Generation,即RAG),便是助力达成这一愿景的关键技术。无论是ChatGPT展示的引用来源功能,还是企业AI对数千份文件进行高效扫描分析,RAG都为语言模型注入了与现实世界紧密相连的根基。不过,RAG并非万能的统一解法。随着研究的持续推进,AI领域的研究人员精心设计出众多各具特色的RAG架构,它们分别针对
2025-05-14 14:38:20
720
原创 GitHub星标16.6K,吴恩达的【大模型入门教程】究竟有什么魔力?
今天给小伙伴们整理的这份大模型入门教程是由斯坦福大学的吴恩达老师和Open AI官方联合推出的大模型系列教程,从大模型时代开发者的基础技能出发,深入浅出地介绍了如何基于大模型 API、LangChain 架构快速开发结合大模型强大能力的应用。非常适用于开发者学习以开启基于 LLM 实际搭建应用程序之路。
2025-05-13 15:09:42
768
原创 AI大模型·白皮书 | 2025年大模型平台落地实践研究报告
报告:2025年大模型平台落地实践研究报告报告由百度智能云与中国信通院联合发布,报告围绕大模型平台展开,探讨其发展背景、落地策略、关键能力、实践案例及未来趋势,旨在为企业建设和应用大模型平台提供参考。
2025-05-12 15:14:05
503
原创 2025 年普通人打算转向 AI 大模型应用开发,关键在于掌握合适的方法‼️
当下,AI在各行业的广泛渗透已是不争的事实,作为2025年炙手可热的焦点话题,众多企业纷纷投身AI产品研发领域,不惜以优厚薪资招揽专业技术人才。如果你有意向朝着AI方向发展,或者已具备一定的后端编程基础,不妨考虑直接转岗从事AI大模型应用开发工作。即便你没有转岗计划,掌握大模型、RAG、Prompt、Agent等前沿概念,并能够独立完成一些简单项目实践,同样可以为你的求职履历增添亮眼的一笔。
2025-05-12 15:10:58
1302
原创 一文搞懂 Agent 的 A2A 与 MCP 协议
最近聊到AI智能体(AI Agent)就不得不说 A2A 和 MCP 这两个协议,那么它们两分别是什么以及它们之间有什么关系呢?接下来我就用这一篇文章让大家搞懂 Agent 的 A2A 与 MCP 协议。
2025-05-10 14:12:38
645
原创 Dify玩转MCP入门教程:接入高德地图MCP Server实战篇
MCP(Model Context Protocol,模型上下文协议)是由AI公司Anthropic于2024年11月提出的开放标准协议,旨在解决大模型与外部工具、数据源之间的交互难题。它通过统一的接口设计,将大模型与外部资源(如数据库、导航软件、办公工具等)无缝连接,被形象地称为“AI界的USB-C接口”。其核心思想是通过标准化协议,简化AI工具与数据源的对接方式,帮助大模型突破能力边界,成为真正具备上下文感知能力的智能体(Agent)。
2025-05-10 14:07:32
1340
原创 中国信通院 | “机器人+人工智能”工业应用研究报告 2025(附下载)
本报告分为研究背景、技术趋势分析、应用现状分析和前景展望四个部分。首先,从技术突破、大国竞争和市场前景三个角度,分析“机器人+人工智能”工业应用的发展背景;其次,从技术趋势的角度,回顾人工智能与机器人融合的三大技术方向,分析在人工智能大模型推动下,以人形机器人为代表的具身智能技术的前沿进展;接着,从应用场景的角度,通过全球88个案例分析“机器人+人工智能”在典型场景、行业中应用情况;最后,从技术、产品和应用三个方面,展望“机器人+人工智能”在工业场景中的应用前景。
2025-05-09 14:58:59
364
原创 大模型入门指南 - Fine-tuning:小白也能看懂的“模型微调”全解析
你是否感到疑惑:为什么AI能够与你探讨哲学、创作科幻故事,然而在处理财报中隐藏于正常数据下的债务危机,或是剖析法律条款中错综复杂的侵权陷阱时,却无法给出完全精准的答案,如同一位知识面广泛却并非专精的优等生?实际上,这就好比一位全能型学霸,尽管学识渊博,但在面对特定学科的难题时仍需查漏补缺,而模型微调(Fine-tuning)正是让AI实现精准“查漏补缺”的关键技术。
2025-05-09 14:56:39
967
原创 斯坦福《2025年人工智能指数报告》,全球AI研发、应用与发展现状
2025年人工智能指数报告》深入探讨了人工智能在多个领域的现状与未来发展趋势。报告强调了AI在硬件生态、推理成本、学术研究、专利趋势等方面的持续进步,同时首次纳入了负责任AI(RAI)的追踪数据,展示了AI在医学和科学领域的广泛应用。2024年,AI的能力进一步突破,有关AI的研究获得了诺贝尔奖和图灵奖等重要奖项,应用普及率达到历史新高,企业投资急剧增加。报告详细分析了全球AI研发的现状,指出产业界,尤其是在美国,在标志性AI模型的开发中占据主导地位;
2025-05-08 14:34:38
2770
原创 从简介到搭建全攻略,手把手教你,搭建独属于自己Coze。
Coze 平台是国内领先的智能体创建与管理平台,它专为零代码或低代码开发者设计,极大地降低了开发门槛,让更多人可以参与到智能体的创建中来,无论是专业开发者还是普通的 AI 爱好者,都能轻松上手。扣子是新一代 AI 应用开发平台。无论你是否有编程基础,都可以在扣子上快速搭建基于大模型的各类 AI 应用,并将 AI 应用发布到各个社交平台、通讯软件,也可以通过 API 或 SDK 将 AI 应用集成到你的业务系统中。
2025-05-08 14:30:46
943
原创 AI大模型·白皮书 | 脉脉:2024大模型人才报告(PPT 可编辑)(附大模型应用开发 动手做AI Agent下载)
由脉脉高聘人才智库发布,指出大模型领域未现“抢人大战”,整体人才饱和,部分技术岗位紧缺。大模型五虎员工规模均在数百人,技术研发人才占多数。大模型相关内容热度持续增长,人才集中在一线城市,北京领先。整体人才供大于求,新发岗位平均月薪小幅上涨,招聘高峰在3月,算法工程师等高技术岗位紧缺,云计算人才最紧缺。互联网大模型岗位需求居首,字节跳动、小红书等企业在大模型人才招聘中表现突出,大模型高薪岗位分布广泛。近3成新发岗位要求硕博学历,远超新经济行业平均水平。
2025-05-07 14:24:03
783
原创 AI 入门,从零搭建完整 AI 开发环境,并写出第一个 AI 应用
手写数字识别是 AI 领域一个经典的入门项目。我们将使用 TensorFlow 构建一个简单的神经网络模型,训练它识别 0 - 9 的手写数字图像。
2025-05-07 14:21:19
908
原创 大模型人工智能Agent到底是什么,一文搞懂智能体相关概念及原理
简单来说,AI Agent 就像是一个能在数字世界中自主行动的 “智能小助手”。它可以是一个软件程序,也可以是一个具备一定智能的系统。它能够感知周围环境,根据自身的目标和规则,自主地做出决策并采取行动,就像我们人类在生活中会根据不同的情况做出反应一样。比如,你手机里的智能语音助手,它就是一个 AI Agent,它能听懂你的指令,然后帮你完成打电话、设置闹钟等任务。
2025-05-06 13:45:05
1391
原创 为什么一定要做Agent智能体?
Agent智能体不是选择题,而是必答题。它正在重构人类与技术的协作模式:从“人找工具”到“工具找人”,从“被动执行”到“主动规划”。尽管面临技术和商业化挑战,但正如智能手机从实验室走向大众只用了十年,Agent智能体也将在未来五年内深刻改变我们的工作与生活。现在投入Agent研发,就是在抢占下一代生产力革命的制高点。
2025-05-06 12:02:24
1004
原创 大模型入门必读书籍,《动手做AI Agent》从基础理论到项目实操!(含PDF)
ChatCPT的横空出世,让人工智能进入一个新的纪元,而LLM大模型也成为人人炙手可热的话题。然后光有LLM大模型并不能真正的能够普及和应用。AI Agent概念,才是真正将AI热潮推向了新的高度,未来可以说你不懂LLM大模型,但是你一定要懂AI agent。《动手做AI Agent》是一本由黄佳老师创作的新书,旨在从零开始手把手教读者制作AI Agent。书中不仅介绍了Agent的定义、特性与技术架构,还详细讲解了构建Agent的AI技术工具,并以7个实战项目展示了Agent开发的方法。
2025-05-05 14:51:42
1071
原创 终于清楚了!机器学习、深度学习、强化学习、迁移学习、集成学习和关联规则学习大解析
简单来说,机器学习就是让计算机通过数据来学习,而不是直接告诉它该怎么做。就像我们人类一样,不是每件事都需要别人告诉我们怎么做,有时候我们通过观察和实践就能学会。
2025-05-05 14:40:10
1309
原创 一文彻底搞懂Fine-tuning - 预训练和微调(Pre-training vs Fine-tuning)
在SFT的基础上,通过强化学习和人类反馈来进一步微调模型,使其输出更加符合人类的偏好或期望。
2025-05-04 09:30:00
628
原创 2025年人人懂AI之从机器学习到大模型报告(附下载)
AI 正快速融入日常生活,影响工作、学习和娱乐等多方面。本书面向 IT 从业者和学生,旨在通俗易懂地讲解 AI 基础知识,包括机器学习、深度学习和神经网络等原理,并分享大语言模型(LLM)等 AIGC 应用。报告首先介绍了 AI 的定义,将其视为基于数学和统计学的工程实践,通过从数据中挖掘规律实现预测。AI 的训练过程涉及数据收集、模型选择、损失函数定义和参数优化。以房价预测为例,通过线性回归模型,利用梯度下降算法最小化损失函数,从而训练出预测模型。
2025-05-04 08:00:00
1440
原创 2025年大模型时代:类脑智能赋能电力应用场景的新模式报告 (附下载
该报告围绕类脑智能在电力领域的应用展开,介绍了类脑计算的背景、发展、与大模型的融合,以及在电力行业的具体应用和成果。类脑计算的背景与优势:随着数字信息爆炸和人工智能发展,冯·诺依曼架构面临瓶颈,类脑计算应运而生。它借鉴生物脑科学原理,具有存算一体、分布式计算等特性,能效优势明显,被视为应对人工智能挑战的新芯片架构,有望实现脑启发的通用智能。类脑计算的布局和成果:类脑计算是国家顶层战略规划方向,中国围绕其理论、芯片、系统、软件、应用等布局项目。
2025-05-03 08:30:00
1536
原创 一文彻底搞懂大模型 - LLM四阶段技术
在探讨大模型(LLM)的四阶段技术时,我们可以从Prompt Engineering(提示工程)、AI Agent(人工智能代理)、Fine-tuning(微调)以及Pre-training(预训练)这四个关键阶段来详细阐述,这四个阶段技术层层递进。
2025-05-03 08:15:00
46
原创 互联网大厂推荐算法实战 附代码 PDF
包括召回、粗排、精排、重排四个模块。还对推荐算法实践中经常遇到的难题给出了应对之道。这部分内容极具价值,因为书中对多任务推荐、多场景推荐、新用户冷启动、新物料冷启动、评估模型效果等实际应用场景进行细致的分析,定位并解决问题,是作者对大厂经验的直接分享。最后一部分是。
2025-05-02 08:45:00
737
原创 大模型入门必看系列——初识大模型
大模型是指具有数千万甚至数亿参数的深度学习模型。近年来,随着计算机技术和大数据的快速发展,深度学习在各个领域取得了显著的成果,如自然语言处理,图片生成,工业数字化等。为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了大模型这一概念。本文讨论的大模型将以平时指向比较多的大语言模型为例来进行相关介绍。
2025-05-02 07:45:00
974
原创 一张图,讲透AI智能体平台的全部核心技术(建议收藏)
如果你对“大模型Agent平台”还有些模糊,这篇文章,建议你一定要看到最后。在AI圈子里,“Agent”(智能体)正在成为下一个风口。不论是开源社区爆火的AutoGPT,还是各大厂争相推出的“AI助手”、“智能客服”,背后核心其实是一件事:构建一个“能听懂、能思考、能执行”的AI智能体平台。但问题是,这个平台怎么搭?大模型怎么选?语音识别、知识库、角色个性要怎么整合?这张《AI大模型Agent平台架构图》给出了一个系统答案:我将用七大章节,带你层层拆解这张图,让你真正理解大模型Agent平台的“骨架”与“灵
2025-05-01 10:00:00
833
原创 华为昇腾DeepSeek解决方案PPT(华为昇腾打造AI全栈生态)
把握DeepSeek时刻:华为昇腾AI解决方案》系统解析了DeepSeek大模型的发展现状及其在华为昇腾AI计算平台上的优化适配。报告指出,DeepSeek作为中国AI技术路线的重要突破,其V3和R1模型在推理能力、算力效率和开源生态方面均取得重大进展。
2025-05-01 08:00:00
321
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人