越哥聊AI
互联网技术专家,阿里云MVP,任职淘宝、美团,著有《分布式技术原理与实战》,拉勾网、InfoQ讲师、人人都是产品经理专栏作者,分享互联网架构,关注认知升级
展开
-
如何用扣子 Coze 打造 AI 客服
在传统电商客服体系中,服务流程通常由智能客服系统与人工客服团队协同完成,并衍生出一系列前后端的配套服务。尽管大模型已经诞生近两年半,目前 AI 客服大都还停留在 SOP 辅助模式或 Copilot 协作模式。“不配置就回复不了”、“机械式单轮问答”、“幻觉问题误导客户”、“无法识别判读意图,答非所问”等问题仍然普遍存在。为了让 AI 客服更智能化,抖音电商客服团队基于扣子Coze 平台,提供了 Agent 模式下的全新解决方案,在 AI 客服场景构建了人机协作的新型服务范式。原创 2025-05-09 12:26:32 · 69 阅读 · 0 评论 -
扣子Agent智能体DeepSeek教程,手把手教你制作国学养生中医视频(附调试流程)
在coze上,实现用工作流+图生视频插件,自动化产出完整的国学养生视频!原创 2025-05-09 00:22:44 · 65 阅读 · 0 评论 -
有哪些好用的AI agent推荐?
AI Agent,简单说就是“能自己干活的智能体”,它不仅能回答问题,更能按流程完成任务,自动处理信息,节省大量重复性工作。我用它做过“AI爆款视频生成器”、“知识问答机器人”、“飞书知识库助手”等,不夸张地说,它是目前国内最适合普通人尝试智能体的平台之一。普通人想用 AI Agent 来“搞钱搞效率”,选「扣子」或者「Manus」就行,功能够用、门槛够低。定位:轻量级工作流 AI Agent 平台,集成搜索、自动摘要、资料整理等功能。适合人群:任何人,尤其是自媒体、客服、运营、老板。原创 2025-05-07 17:25:04 · 224 阅读 · 0 评论 -
最新扣子Coze智能体教程:搭建双十一商品促销海报智能体(附全流程截图)
今天带你用「扣子」零代码搭建一个【大促海报生成智能体】,让你 1 小时完成别人 1 天的活!原创 2025-05-07 11:46:57 · 413 阅读 · 2 评论 -
扣子空间初体验:不用写代码,你的AI全能助理来了【附邀请码分享】
扣子空间初体验:不用写代码,你的AI全能助理来了原创 2025-05-05 20:48:14 · 651 阅读 · 0 评论 -
实现 Transformer:从原理到代码实现
基于自注意力机制(Self-Attention)和前馈神经网络(FFN),去除了传统 RNN 的递归结构,使得训练更快、并行度更高。原创 2025-05-05 11:12:42 · 511 阅读 · 0 评论 -
小米大模型发布,股票悄悄涨了6个点,小爱AI就要来了?
小米的大模型,是在讲一个新的故事——不仅是技术,还是体验升级的引擎。原创 2025-05-04 00:09:02 · 508 阅读 · 0 评论 -
魔搭开源版GPTS来啦!轻松搭建个人超级智能体!
通过简化的操作,可以让更多爱好AI的人来构建GPT的生态,而不需要进行具体的代码开发。原创 2025-04-30 17:41:42 · 700 阅读 · 0 评论 -
使用 DeepSeek 和 Ollama 搭建一个本地知识库系统(包含完整代码)
比如你有一本很厚的说明书,不想一页页翻,只想问它:“这个功能怎么用?用这个系统,你可以轻松地从 PDF 里提取信息,像跟人聊天一样问问题。存储:建议 NVMe SSD,模型文件大小从 1.5B(约 3GB)到 32B(约 64GB)不等。:有不同大小,最小的 1.5B 模型适合普通电脑,更大的模型效果更好,但需要更强的电脑配置。用 Streamlit 做一个上传按钮,把 PDF 传上去,然后用工具提取里面的文字。用 Streamlit 做一个简单的网页,用户可以输入问题,系统会实时返回答案。原创 2025-05-02 16:12:29 · 835 阅读 · 0 评论 -
Google NotebookLM 简明教程
NotebookLM是Google推出的生成式AI服务,是一款创新的笔记本应用程序。它能够根据用户的笔记和上传的材料整理信息并回答问题,为用户提供更高效的信息管理和知识获取体验。如果您经常使用备忘录应用程序来记录想法或作为工作备忘录,强烈建议您立即尝试NotebookLM。这款工具将显著提升您的笔记整理效率,让您的工作更轻松。原创 2025-05-02 16:10:53 · 642 阅读 · 0 评论 -
A2A 协议与 MCP 协议:智能代理生态系统的双轮驱动
A2A 协议和MCP 协议代表了 AI 智能体技术的重要进步,它们共同为更智能、更协作的代理生态系统奠定了基础。原创 2025-05-02 11:48:41 · 426 阅读 · 0 评论 -
如何理解 MCP 和 A2A 的区别?|AI系统架构科普
MCP 全称是 Multi-component Pipeline,中文翻译为「多组件流水线」。你可以把它理解为一种流程驱动的 AI 系统工程方式把一个大任务,拆成多个子任务;每个子任务用一个独立的模块(通常是一个 Prompt + LLM)去处理;每个模块的输出是下一个模块的输入;整个流程像流水线一样运行。👇 举个简单例子:模块1:简历结构分析模块2:提炼项目亮点模块3:匹配岗位 JD模块4:输出优化版简历。原创 2025-05-02 12:00:45 · 259 阅读 · 0 评论 -
10分钟搭建智能体:提取抖音爆款视频文案转小红书(附全流程截图)
回复“扣子模板”可以加入团队空间,获取完整工作流配置原创 2025-05-01 18:54:36 · 140 阅读 · 0 评论 -
AI电商提出2年,现在到底落地到哪里了?
那么,两年过去了,AI电商到底走到了哪一步?有哪些真实落地的场景?哪些吹过的牛实现了,哪些还在路上?原创 2025-04-30 12:16:12 · 551 阅读 · 0 评论 -
解读 AI绘画工作流ComfyUI Stable Diffusion
ComfyUI是一个基于节点流程的Stable Diffusion操作界面,通过自定义节点、拖拽连线实现精准的工作流定制,以完成更复杂的图像生成工作。原创 2025-04-30 15:09:49 · 542 阅读 · 0 评论 -
在阿里云实例上部署通义千问QwQ-32B推理模型
通义千问QwQ-32B是阿里云开源的320亿参数推理模型,通过大规模强化学习在数学推理、编程及通用任务中实现性能突破,支持消费级显卡本地部署,兼顾高效推理与低资源消耗。本文将介绍如何利用vLLM作为通义千问QwQ-32B模型的推理框架,在一台阿里云GPU实例上构建通义千问QwQ-32B的推理服务。在GPU实例上部署通义千问QwQ-32B模型,需要提前在该实例上安装GPU驱动且驱动版本应为550及以上版本,建议您通过ECS控制台购买GPU实例时,同步选中。原创 2025-04-29 18:41:10 · 600 阅读 · 0 评论 -
阿里云ECS上基于 WordPress 一键部署网站
在阿里云 ECS 上部署一个基于。原创 2025-04-24 19:53:27 · 368 阅读 · 0 评论 -
阿里开源通义千问3,性能力压DeepSeek,成本仅需三分之一!
记住,开源不是落后者自救,是领先者亮剑。未来,国产大模型的胜负手,一定还在路上。但今晚,属于阿里,也属于所有愿意相信技术力量的人。原创 2025-04-29 18:41:57 · 225 阅读 · 0 评论 -
抖音公开推荐算法细节了!看完才知道,我们其实一直被误会了
在他们的官网上,首次系统性公开了抖音推荐算法的核心原理,包括背后的数学逻辑、模型演化路径,甚至是如何预测我们会不会点赞、评论、转发!原创 2025-04-23 15:52:23 · 1063 阅读 · 0 评论 -
一次Token是一次调用?你可能误解了大模型的计费单位
关键词理解方式Token 是什么处理文本的最小单位,不等于字或词Token 用来干嘛模型输入输出的计费依据Token 怎么算按字符分割,有经验公式和工具可查如何节省 Token优化提示词、控制 max_tokens、拆分上下文Token 的底层意义是模型注意力机制的基本计算单位如果你觉得大模型太贵、跑得太慢,很多时候不是因为模型太差,而是你“没搞明白 Token”。它不只是一个“计费单位”,而是你和 AI 沟通的语言粒度。原创 2025-04-16 11:20:08 · 696 阅读 · 0 评论 -
如何理解AI-First产品设计模式
"AI-First" 是过去几年科技圈的高频概念,尤其在大模型时代重新被提起,代表着一种从AI能力出发设计产品、组织与商业模式的范式变革。原创 2025-04-08 22:51:03 · 579 阅读 · 0 评论 -
定制化自己的 RAG 框架:结合 LlamaIndex 与自定义优化
本篇文章将介绍如何定制自己的 RAG 框架,并重点探讨 LlamaIndex 在索引管理与句子窗口解析方面的优化,以及如何整合 RAG 框架的优点到自己的项目中原创 2025-04-02 22:37:29 · 704 阅读 · 0 评论 -
不同向量数据库(FAISS / Pinecone / Weaviate)在 RAG 中的优缺点
FAISS、Pinecone 和 Weaviate 是当前主流的向量数据库,它们各有优缺点,适用于不同的应用场景。原创 2025-04-02 22:06:24 · 1149 阅读 · 0 评论 -
RAG 在 AI 助手、法律分析、医学 NLP 领域的实战案例
RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索和生成模型的技术,广泛应用于 AI 助手、法律分析、医学 NLP 等领域原创 2025-04-02 22:03:08 · 1261 阅读 · 0 评论 -
Function Calling 和 ReAct 让 AI 大模型更加智能
Function Calling 和 ReAct 让 LLM。原创 2025-04-03 11:41:43 · 1021 阅读 · 0 评论 -
DeepSeek对比ChatGPT有何改进,可以用更低成本计算
下面是基于DeepSeek公开论文和代码,与ChatGPT对比后总结的改进点,以及其为何能用更少算力训练大模型的解析。原创 2025-04-07 09:53:23 · 794 阅读 · 0 评论 -
大模型开发的不同范式:应用、微调和专有模型
层级范式门槛可控性成本适合人群1应用开发(API + Prompt)低低低初创、个人开发者2微调开发(SFT、LoRA)中中中专业团队3专有模型开发高高高科研机构、大厂。原创 2025-04-07 12:21:10 · 734 阅读 · 0 评论 -
AI创业机会:寻找技术可实现但认知未普及领域
信息差(Information Asymmetry)确实是商业竞争中的核心变量,尤其在技术变革期会催生结构性机会。原创 2025-04-03 14:43:07 · 648 阅读 · 0 评论 -
OpenAI Function Calling 函数调用能力与外部交互
如果您遇到标记限制,我们建议限制函数数量或您为函数参数提供的描述的长度。为 OpenAI 模型提供了一种强大而灵活的方式与您的代码或外部服务进行交互。定义的,所以您可以利用它的许多丰富的功能,如属性类型、枚举、描述、嵌套对象和递归对象。流式传输可用于显示进度,通过显示在模型填充其参数时调用哪个函数,甚至实时显示参数。函数由其架构定义,架构告知模型其功能以及其所需的输入参数。然后,您将执行函数代码,发回结果,模型会将它们合并到最终响应中。但是,您不是将各块聚合成单个字符串,而是将各块聚合成编码的。原创 2025-04-03 15:20:08 · 876 阅读 · 0 评论 -
为什么相同prompt,Transformer 返回结果不一样
Transformer 本质是生成“概率分布”,不是选唯一答案使用了不同的采样策略语言本身就有丰富的“多样性”和上下文理解偏差ChatGPT 等模型为了提高“互动性”、“创造性”,故意引入了“不确定性”原创 2025-04-06 23:58:44 · 427 阅读 · 0 评论 -
ChatGPT不是AI,而是数学?真相远比你想的复杂
ChatGPT不是AI,而是数学?”这个说法有点片面,也有其道理。它强调的是:AI的底层是人类智慧的结晶,是科学与工程的成果。但别忘了,飞机也是一堆金属、螺丝和电路,但它能带你飞越万里。ChatGPT也是一堆矩阵和公式,但它能用语言连接你我。这背后的逻辑和美感,远比“它只是统计”来得深刻。原创 2025-04-07 09:43:32 · 483 阅读 · 0 评论 -
使用 LangChain4j 构建本地 RAG 系统
最新的 chatGPT-4o 只能基于 2023 年 6 月之前的数据进行回答,距离目前已经快一年的时间,如果想让 GPT 基于近一年的时间回复问题,就需要 RAG(检索增强生成)技术了。原创 2025-04-07 12:14:59 · 1166 阅读 · 0 评论 -
大模型ReAct:思考与工具协同完成复杂任务推理
ReAct框架可以让现有应用得到一次智能化的进化的机会。以前需要人工编排服务调用链路会成为历史。原创 2025-04-03 11:46:19 · 1125 阅读 · 0 评论 -
Transformer原理及知识体系大纲
Transformer原理以及通过案例讲解,包括 1. Transformer架构通过输入文本,预测下一个字的概率,实现自然语言处理任务。原创 2025-04-06 23:54:07 · 568 阅读 · 0 评论 -
AI大模型下传统 Spring Java工程开发的演进和变化方向
传统的Spring Java工程正经历从“业务逻辑+数据库”向“业务逻辑+AI推理+数据智能”的演进。原创 2025-03-31 09:54:40 · 530 阅读 · 0 评论 -
Stanford CS230 Deep Learning 课程内容
斯坦福大学 CS230 课程是 Andrew Ng 主讲的深度学习课程,专注于神经网络、优化技术及其在计算机视觉、自然语言处理等领域的应用。原创 2025-03-31 09:27:44 · 472 阅读 · 0 评论 -
AI Agent 人工智能相关公开比赛汇总
参与 AI 相关比赛是提升技术能力、接触前沿算法、积累项目经验的绝佳方式。以下是全球知名的比赛,以及适合不同水平选手的竞赛分类。NeurIPS/CVPR/ICML 竞赛、Facebook FAIR、NASA Space Apps。Kaggle 初级比赛、Google Kick Start、AI4Good Hackathon。Devpost Hackathons、Tianchi 天池、Baidu AI 竞赛。ACM-ICPC、Google Code Jam、Kaggle 竞赛。你对哪些比赛最感兴趣?原创 2025-03-30 20:59:09 · 1258 阅读 · 0 评论 -
机器学习与AI大模型必备数学知识
机器学习与AI大模型必备数学知识原创 2025-03-30 23:34:53 · 785 阅读 · 0 评论 -
人工智能、机器学习经典计算机课程
以下是人工智能(AI)、机器学习(ML)和 AI 大模型相关的经典计算机课程,从入门编程、数学基础到深度学习、强化学习、自然语言处理(NLP)及 AI 领域实践等,适合不同阶段的学习者原创 2025-03-31 09:36:55 · 969 阅读 · 0 评论 -
BabyAGI 快速上手应用
BabyAGI 是一个轻量级、自我迭代的任务管理 AI Agent,基于 OpenAI API 和 Pinecone 向量数据库构建。原创 2025-03-31 14:22:05 · 253 阅读 · 0 评论