自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1027)
  • 收藏
  • 关注

原创 新手必看!我如何6步用(Coze)轻松搭建了一个AI智能体

AI智能体就像是一个虚拟的"小助手"。它能听懂你的话,理解你的需求,并帮你完成任务。想象一下,你有了一个24小时待命的私人助理,随时随地为你服务。这就是AI智能体的魅力所在。

2025-01-04 17:19:05 7021

原创 一图了解大模型是什么?附国内外知名大模型及240余家大模型清单!

引申到模型层面,涌现能力指的是当模型的训练数据突破一定规模,模型突然涌现出之前小模型所没有的、意料之外的、能够综合分析和解决更深层次问题的复杂能力和特性,展现出类似人类的思维和智能。简而言之,大模型是指利用海量数据,通过先进的算法和技术,训练得到的具有强大预测和决策能力的模型。它们利用大算力、使用海量的开放数据与具有巨量参数的深度学习算法,在大规模无标注数据上进行训练,以寻找特征并发现规律,进而形成可“举一反三”的强大泛化能力,可在不进行微调或少量微调的情况下完成多场景任务,相当于AI完成了“通识教育”。

2024-12-09 16:00:36 3174

原创 太强了!10大开源大模型!

近期,Meta 隆重推出了两款开源模型:Llama 3 8B与Llama 3 70B,这两款模型可供外部开发者免费使用。Meta 表示,Llama 3 8B和Llama 3 70B在目前同体量模型中,展现出卓越的性能,堪称业界的佼佼者。从Meta 分享的基准测试结果来看,Llama 3 400B+ 的实力不容小觑,其性能已逼近Claude超大杯以及新版GPT-4 Turbo,虽然还存在一定的差距,但足以证明它在顶尖大模型领域已占有一席之地。

2024-11-23 11:20:38 4481

原创 “农业+大模型”的八大应用场景及成功案例

当前处于一个农业生产力提升与城镇化融合发展的一个关键时期,此前受耕作主体分散和生产水平的影响,我们的农业在解决了温饱水平之后,长时期处于碎片化作业与集约化程度不足的状态。随着近年智慧化应用积累和大模型的快速发展,“农业+大模型”的结合发展成为一种新的产业形态,也需要从体制到从业主体各个层面的改革以适应科技生产力的发展。农业与大模型的结合是新质生产力的体现,大模型在农业中的应用正是通过引入先进的人工智能技术,提升农业生产的智能化、精准化水平,从而创造新的价值和效率。丨。

2024-11-07 16:39:52 3009

原创 什么是LLM?看这一篇就够了!

自从2022年12月 ChatGPT 横空面世以来,AI 领域获得了十足的关注和资本,其实AI的概念在早些年也火过一波,本轮 AI 热潮相比于之前的 AI,最大的区别在于:生成式。本文主要介绍大语言模型(Large Language Model,简称LLM)。通过海量文本训练的、能识别人类语言、执行语言类任务、拥有大量参数的模型,称之为大语言模型。

2024-08-20 20:44:43 2971

原创 无需本地部署!免费使用开源大模型API

之前,我给大家分享过几篇关于如何在本地部署开源大模型以及应用场景的文章。比如说,给本地大模型添加知识库、API的调用等等。在这个过程中,有粉丝反馈自己不会部署,或者电脑配置不好,想知道还有没有办法使用这些开源大模型。今天就来分享一个免费且无门槛使用各种主流开源模型及其API的方法,让你不用在本地部署开源模型,也可以在各种第三方应用中调用这些模型,例如翻译插件、Dify的工作流、对话应用等等。这些场景下都可以用这个方法来省钱。我们今天要用的平台名字叫Groq。

2024-07-10 09:53:46 3262 1

原创 图解 LangChain 园林设计,画到凌晨只为你规划完美景观

LangChain 就像一位经验丰富的园艺大师,帮你设计和打造完美的 AI 应用花园。2. 提示词模板2. 记忆管理2. 多轮设计对话LangChain 是打造 AI 应用的强大工具,可以帮你:掌握了这些组件,就能设计出赏心悦目的 AI 应用了!记住,就像园林设计一样,简约而不简单才是真谛~作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是

2025-04-24 15:22:34 645

原创 ChatGPT大揭秘!《ChatGPT 应用与教学》免费分享

你是否在社群上看别人玩得出神入化,但自己用起来,却没有想像中那么神。很多公司开始把 ChatGPT 导入到工作流程与产品创新,但你是否连怎么简易串接都不知道怎么做?不用担心。因为我们汇整了一系列的教学,手把手带着你,一步步掌握 ChatGPT 时代应该具备的应用能力。

2025-04-24 15:12:00 300

原创 【入门必看】大模型是什么?大模型综述,看完不走弯路!

是使计算机模拟人类智能行为的科学,包括学习、推理和自我改进。

2025-04-23 15:35:02 483

原创 一文看懂MCP,理论+实践,教你搭建MCP应用

MCP,全称是Model Context Protocol,模型上下文协议,由Claude母公司Anthropic于去年11月正式提出。MCP刚发布的时候不温不火,直到今年Agent大爆发才被广泛关注。而在今年2月,Cursor正式宣布加入MCP功能支持,一举将MCP推到了全体开发人员面前。从本质上来说,MCP是一种技术协议,一种智能体Agent开发过程中共同约定的一种规范。这就好比秦始皇的“书同文、车同轨”,在统一的规范下,大家的协作效率就能大幅提高,最终提升智能体Agent的开发效率。

2025-04-23 15:23:49 788

原创 一文读遍 LoRA 家族:大语言模型高效训练的“秘密武器“

LoRA 的核心做法是在预训练权重矩阵 W 旁边添加两个较小的可训练矩阵 A 和 B,同时不改变 W 的参数。想象一下,预训练的权重矩阵 W 是一个经验丰富的 “老将”,已经具备了很多通用知识,但在应对特定任务时还不够完美。这时,矩阵 A 和 B 就像是两个灵活的 “小助手”,在不打扰 “老将” 的情况下,通过自身的训练,为模型在特定任务上提供额外助力。

2025-04-22 16:18:44 882

原创 大模型系列:什么是AI Agent,一文搞清AI Agent!

1. 它是「机器人」吗?不完全是!机器人是硬件载体,而AI Agent是「智能内核」。比如Siri没有实体,但能通过手机麦克风感知你的需求,调用算法生成回应——「感知→决策→执行」的闭环,就是Agent的核心逻辑。2. 它和普通软件的区别?普通软件像「听话的执行者」,你输入指令才会动;而Agent是「有目标的主动者」。比如网购推荐系统会主动分析你的浏览记录,预判你可能喜欢的商品,甚至在大促时帮你规划最优凑单策略——自带「目标驱动」属性,是Agent的终极浪漫。3. 它有「自我意识」吗?目前没有!

2025-04-22 15:43:21 1244

原创 10分钟让WPS接入DeepSeek,实现AI赋能

在办公场景中,WPS 作为一款强大的办公软件,不仅提供了丰富的文档编辑功能,还支持宏(Macro)来实现自动化处理。随着人工智能技术的发展,将大模型(如 ChatGPT、DeepSeek、文心一言等)集成到 WPS 中,可以大幅提升文档编辑、内容创作、数据分析的效率。本文介绍如何通过 WPS JS宏调用 DeepSeek 大模型,实现自动化文本扩写功能。1.随便打开一个word文档,点击工具栏“工具”2.点击“开发工具”3.点击“查看代码”

2025-04-21 16:24:29 748

原创 一文带你了解RAG核心原理!

看完本篇分享的每个步骤大家再返回文章开头看RAG全貌是不是清晰很多。RAG系统通过数据准备数据检索和LLM生成三个核心环节把外部知识和大语言模型能力完美结合,使得用户能够收获更专业更准确的知识(从文档中获取的内容尽量避免大模型幻觉)。RAG系统因其知识随时更新,回答检索靠谱被广泛应用于智能客服、学习助手等领域。作为RAG系统的使用者甚至开发者,我们只有了解RAG系统的核心原理,才能找准RAG系统提升优化的思路,让RAG系统变得更加高效可靠。

2025-04-18 16:14:21 655

原创 打工人福音!DeepSeek+Coze扣子搭建智能体(保姆级教程)

其实国产AI的能力已经相当强大了,关键是要用对工具。

2025-04-18 16:12:57 1244

原创 2025年最火AI开源项目盘点:从多模态大模型到深度研究智能体

多模态架构普及化智能体能力实体化端侧部署平民化。建议开发者重点关注Llama 4与Qwen2.5-Omni的融合应用,探索AutoGLM在科研自动化场景的潜力。

2025-04-17 10:46:44 1210

原创 Agent是什么?手把手带你从零构建Agent

首先,我们需要一个处理用户输入的模型。我们将创建一个OllamaModel类,它与本地API交互以生成响应。

2025-04-17 10:46:26 951

原创 2025年大模型算法岗,竞争简直太激烈了。。。

最近春招和日常实习已开启。不同以往的是,当前职场已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。万万没想到啊,上海人工智能实验室实习岗居然都这么卷,HR反馈当前岗位投递人较多,让耐心等待结果,竞争真的太激烈。所以说啊,无论是实习还是找工作,还是要提前做准备,越早越好啊,希望助力大家都能拿到心仪的offer!

2025-04-16 16:09:15 909

原创 LangChain、Dify等十款主流LLM应用框架比较

随着大型语言模型(LLM)的普及,开发者们需要强大的框架来快速构建智能应用。从聊天机器人到知识库搜索,市场上有许多工具可以简化开发流程。本文将比较十款主流开源框架:以下是这十款框架的简要概览,展示它们的定位和核心功能:我们从七个关键维度对比这些框架:易用性、定制化、开发速度、可扩展性、社区支持、集成能力和适用场景。推荐:新手选 Dify,兼顾易用和灵活选 Langflow。推荐:复杂项目选 LangChain,数据任务选 LlamaIndex。推荐:快速原型选 Dify,视觉开发选 Flowise 或 La

2025-04-16 15:54:03 1367

原创 DeepSeek精通和AI办公提效(PPT 可编辑)

全书分为三大模块:DeepSeek基础概念、实操技巧与办公提效场景,结合案例详细解析提示词设计、本地模型部署、会议纪要生成、财务分析等实用技能。无论是产品经理、数据分析师还是普通职场人士,都能从中获得快速解决问题、提升决策质量的AI赋能方案,帮助用户在智能化办公浪潮中抢占先机。是一本专注于AI工具实战应用的权威指南。

2025-04-15 16:10:12 326

原创 2025年最值得尝试的3个AI 大模型

在人工智能的蓬勃发展浪潮中,国产 AI 大模型百花齐放,各显神通。今天,让我们一同深入剖析当下最炙手可热的五款国产 AI 大模型 ——DeepSeek、豆包、Kimi。它们宛如璀璨星辰,在不同领域散发着独特光芒。有的在专业分析领域一骑绝尘,精准洞察数据背后的奥秘;有的凭借娱乐互动功能,成为人们日常闲聊、创意激发的得力伙伴;还有的以卓越的长文本处理能力出圈,助力学术研究、文档创作。那么,究竟哪一款模型才是最契合你需求的 “天选之子” 呢?别着急,跟随这篇深度解读,你将找到答案。

2025-04-15 15:18:45 870

原创 首个开源的金融行业大模型Fin-R1上线模力方舟

Fin-R1 是一款针对金融领域复杂推理的大型语言模型,由上海财经大学统计与数据科学学院张立文教授与其领衔的金融大语言模型课题组(SUFE-AIFLM-Lab)联合财跃星辰研发并开源发布。该模型以 Qwen2.5-7B-Instruct 为基座,通过高质量的可验证金融问题微调训练,最终表现在多个金融领域基准测试上的表现达到参评模型的 SOTA 水平。Fin-R1 是一款专为金融推理领域设计的大语言模型,采用轻量化的 7B 参数量级架构。

2025-04-15 15:15:57 835

原创 超厉害!企业知识库RAG chatwiki打破传统,引领知识库智能体新变革

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。AI回复:“最近账单500元,还款日期10月25日,有疑问看这里:[链接]”

2025-04-14 15:25:13 760

原创 一文讲清楚关于智能体之间的协作方式-A2A协议

A2A,也就是Agent to Agent协议,是由Google推出的开源协议,旨在实现AI智能体之间的通信和互操作性,通过为智能体提供标准化的协作方式,无论其底层框架或供应商如何,该协议使AI智能体能够安全地交换信息、协调行动,并跨各种企业平台和应用程序工作。例如,在实际应用中,A2A使智能体能够在类似招聘候选人这样地复杂任务上连接和写作,用户可以要求其智能体查找匹配职位列表的候选人,该智能体通过A2A与其他专业智能体交互,以寻找潜在的候选人、安排面试并进行背景调查-所有这些都在统一的界面中完成。

2025-04-14 15:20:31 728

原创 泪奔!DeepSeek + Crawl4AI搭建智能爬虫,一句话获取想要的数据

现在回头看,Crawl4AI + DeepSeek 这组合,确实让我有一种“终于不靠体力劳动赚钱”的感觉。以往我写个小项目,要整三天抓数据,前两天在写 XPath 和调结构,最后一天才能处理内容,现在换成 AI 帮我看页面,我只管告诉它我要什么字段,它不仅帮我找到,还能帮我格式化。它不是一个传统意义上的爬虫框架,更像是“你说话,它干活”的网页助手,对于数据工作者来说,效率提升不是一点半点。就算你不搞爬虫,单纯需要从页面提点结构化信息出来,它也值得一试。我的DeepSeek部署资料已打包好(自取↓)

2025-04-12 15:28:11 908

原创 什么是扣子(coze),一文读懂扣子(Coze)平台

扣子(Coze)是由字节跳动推出的**一站式AI应用开发平台**,旨在降低AI开发门槛,让用户无需编程经验即可快速创建、调试和部署各类AI智能体(如聊天机器人、自动化工具等),并支持多场景发布和商业化应用。以下是其核心功能与能力的详细解析:

2025-04-12 15:14:42 1785

原创 一文读懂 RAG:开启企业 AI 时代的智能引擎

RAG 凭借自身独特的优势,改变着许多行业的工作方式。如今,从客服问答、内容创作,到专业领域的决策辅助,RAG 都已展现出显著成效。随着技术的持续迭代,我们完全可以预见,RAG 会在更多场景中落地生根,给我们的生活和工作带来更多便利。

2025-04-11 14:37:12 1126

原创 一文彻底搞懂谷歌的Agent2Agent(A2A)协议

Agent2Agent (A2A) 框架的核心在于其定义的一系列标准化技术组件,旨在确保异构AI智能体(Agent)之间能够进行有效、可靠且安全的互操作。

2025-04-11 14:22:25 1950

原创 最新!2025年TOP大模型!

如果我们必须用一个词来形容今天 AI 的快速发展,那可能就是类似“爆炸性”的词汇。正如《市场研究未来》报告所预测,仅北美地区的大型语言模型市场预计到 2030 年将达到 1055 亿美元。AI 工具的指数级增长与对海量文本数据的访问,为我们开启了比以往任何时候都更好、更高级的内容生成的大门。然而,这样的快速扩张也使得在众多模型中选择合适的工具变得比以往任何时候都更加困难。本文的目标是让您,AI 爱好者和专业人士,了解该领域当前的趋势和关键创新。

2025-04-10 14:17:39 1365

原创 AI进化论:一文读懂大模型AI agent的三轮热潮!

在最近的十多年间,人工智能已经历了两轮风格迥异的发展热潮,如今正踏入第三次热潮。每一次都是对前一阶段能力局限性的突破。传统机器学习(ML)专注于特定的预测任务,如分类、回归、聚类等。构建诸如支持向量机(SVM)、随机森林等模型,需要深厚且广泛的专业知识储备。这是由于它们并非通用型模型,而是针对单个用例,历经大量的研究、实验与调试,精心设计而成。以SVM为例,其通过寻找一个最优超平面来实现数据分类,这个超平面要使不同类别的样本间隔最大化,涉及到复杂的数学原理和算法调优;

2025-04-10 14:15:47 821

原创 一文谈谈智谱大模型算法岗面经!

面试官首先让我手撕一个 tokenizer,tokenizer 是自然语言处理中用于将文本拆分成一个个标记(token)的工具。我从最简单的字符级别 tokenizer 开始讲起,然后逐步扩展到基于词典的分词方法,最后还提到了一些基于深度学习的预训练分词模型,如 BERT 的 WordPiece 算法。面试官对细节把握得很严,让我详细解释了如何处理一些特殊字符、未知词汇等问题;还让我用伪代码简单描述了 RAG(Retrieval-Augmented Generation)模型的基本流程。RAG 是一种结

2025-04-09 14:16:59 818

原创 面试装X用:DeepSeek那些不为人知的事!

DeepSeek R1在数学、代码、自然语言推理等任务上。

2025-04-09 14:15:16 662

原创 北大团队亲授!DeepSeek私有化部署和一体机选型全景指南

DeepSeek 私有化部署方案正在重塑 AI 应用生态。从 Ollama 的极简部署到 vLLM 的高并发优化,从消费级硬件的性能挖掘到科研集群的深度适配,技术选型策略已逐步清晰。随着国产硬件生态的完善,大模型部署正从实验室走向产业化,这场由技术创新引发的 AI 民主化浪潮,或将重构整个行业的竞争格局。我的DeepSeek部署资料已打包好(自取↓)

2025-04-08 14:26:09 844

原创 真香警告!给大模型插上MCP翅膀,程序员直呼“要啥有啥”

最近,如果你经常接触AI编程,肯定听到过 MCP 这个概念?顶流网红了属于是。,字面意思 是一种开放标准协议,它像“USB接口”一样,为AI大模型(如GPT、Claude)与外部工具(地图API、数据库等)提供标准化连接方式。通过MCP,AI无需复杂编程即可调用外部资源,实现更复杂的任务处理,例如路线规划、数据分析等过去,大模型能写诗、能聊天、能回答复杂问题,但一旦涉及到调用API、查询实时数据、绘制图表、查地图等具体任务时就抓瞎,无法真正融入实际应用场景。

2025-04-08 14:16:29 484

原创 大模型应用开发:从0基础入门到项目实战,教你动手做AI Agent!

对于构建 Agent 来说,目前业界已经具备技术基础,包括大模型和 AIGC 模型、人工智能应用开发框架和工具、软件平台、丰富的数据等。只要结合具体的业务场景,将现有技术进行整合,就能开发出满足需求的 Agent。《动手做 AI Agent》从零基础出发,介绍了 Agent 的定义、特性与技术架构,还对构建 Agent 的 AI 技术工具进行了详细讲解,最后以 7 个实战项目展示了 Agent 开发的方法。按照“基础知识——技术工具——项目实战”三部分来组织内容,帮助读者从理论学习推进到动手实际操作。

2025-04-07 14:13:39 1113

原创 本地部署DeepSeek+DiFy平台构建智能体应用

RAG(Retrieval-Augmented Generation)检索增强生成是一种将外部知识检索与大语言模型生成能力结合的混合架构。其核心思想是通过检索外部知识库(如文档、数据库、网页等),弥补大模型静态训练数据的局限性;在生成答案时直接依赖检索到的证据,减少模型凭空编造内容的可能性,降低幻觉风险。RAG无需重新训练模型,仅需更新知识库即可适配不同专业领域(如医疗、法律)。类似将大模型视为一个“推理专家”,而RAG系统为其配备了一个“实时资料库助手”。

2025-04-07 14:07:09 1421

原创 一文彻底搞懂天天被提到的Agent是什么?

AI Agent(人工智能代理)是一种能够并的智能实体。与传统AI系统不同,Agent不仅能回答问题,还能主动完成一系列复杂任务。简单来说,如果把大语言模型LLM)比作一个"超级大脑",那么AI Agent就是给这个大脑装上了"手脚"和"工具",让它能够像人类一样主动行动,而不仅仅是被动回答问题。举个例子,如果你对ChatGPT说:“帮我写一篇关于气候变化的文章”,它会直接生成一篇文章。但如果你对AI Agent。

2025-04-03 10:54:09 677

原创 AI大模型·白皮书 | 《DeepSeek、Manus与AI Agent行业现状》(PPT 可编辑)

定义与架构:AI Agent是能感知环境、决策并执行动作的智能实体,基于大语言模型(LLM)的AI Agent由感知、规划和行动构成。其理想技术架构包含记忆、反思、工具使用等模块,与大模型在定义、核心能力、应用场景和技术实现等方面存在差异。不同规模企业的使用率均呈上升趋势,在医疗、人力资源、零售等行业有显著应用成果,如提高效率、降低成本、增加收入等。报告围绕AI Agent展开,深入探讨其概念、技术进展、行业现状、面临问题及对企业经营的影响,展现了AI Agent在当下科技发展中的重要地位与应用前景。

2025-04-03 10:08:03 472

原创 如何使用DeepSeek绘制好看的热图?

最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。老师,这个地方我不会啊。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。继续点击以上代码块右上角的“复制”按钮,将DeepSeek生成的代码复制粘贴到新的脚本编辑器窗口中进行运行,新代码的绘图效果如下图。

2025-04-02 14:22:19 934

原创 LLM 推理优化进度大揭秘,自 DeepSeek R1 后推理时计算扩展有何新突破?

提升大语言模型(LLM)的推理能力已成为 2025 年最热门的话题之一,这是有充分理由的。更强的推理能力使 LLM 能够解决更复杂的问题,在用户关心的各种任务中表现得更为出色。在过去几周里,研究人员分享了大量提高推理能力的新策略,包括推理时计算扩展、强化学习、监督微调和模型蒸馏。许多方法结合了这些技术以达到更好的效果。本文探讨了推理优化 LLM 的最新研究进展,特别关注自 DeepSeek R1 发布以来出现的推理时计算扩展方法。

2025-04-02 14:18:36 973

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除