- 博客(504)
- 资源 (19)
- 收藏
- 关注

原创 AI Agent开发第57课-AI用在销售归因分析场景中-用随机森林从0构建自己的“小模型”
在前一篇《机器学习的基础-线性回归如何应用在商业场景中》里,我们说到了如果我们只是简单的分析和预测一下投入广告费用和销售额增长是否存在必然关系,我们用了线性回归法得到了分析,得到的分析结果极其精准,以及提到了:如果当销售因素是非线性的并且有着额外一些如“突发事件、活动”信息时,我们的分析就不能用线性回归了,今天我们就在上一次课的基础上用真实数据(来自于某巨型零售商超真实数据)使用“随机森林”来预测“活动”对销售额带来的影响是怎么样的?
2025-05-06 23:46:02
244

原创 强化学习是AI Agent的进化引擎还是技术枷锁呢?
强化学习(RL)作为AI Agent的核心技术,既被视作赋予自主决策能力的“灵魂”,也因环境依赖性、泛化能力不足等问题被质疑为技术包袱。本文通过对比RL在Agent发展中的实际案例、行业观点与技术瓶颈,揭示其在推动Agent从工具向智能体跃迁中的双刃剑作用,探讨技术演进的复杂性与未来方向。
2025-05-06 19:06:35
409

原创 DeepSeek后大模型的思维链到底是什么?它是从混沌走向理性的标志
思维链(Chain of Thought, CoT)技术的崛起,彻底改变了大模型的逻辑推理能力。自Deepseek-R1验证其效果后,主流模型纷纷采用该技术,通过模拟人类分步思考的方式,显著提升解题正确率。本文剖析思维链的技术路径、演进逻辑与行业影响,揭示其如何成为AI推理能力的"智力催化剂"。
2025-05-05 20:34:07
512

原创 AI Agent开发第50课-机器学习的基础-线性回归如何应用在商业场景中
器学习是现代AI的基础与基石,一些机器学习、深度学习在现在AI大模型大兴起道上其实一点没有过实,经历过大型复杂项目的都知道,你不可能在项目中100%全部使用大模型来解决的,比如说你手上有100万条数据要计算预期投入多少广告费收入可以增长多少,难道你会把100万条数据往大模型里一扔让大模型解决吗?这样的场景太多了,而解决它们依然使用的是机器学习,因此今天我们就带大家逐步通过最简单的线性回归来进入机器学习的领域
2025-05-05 18:53:15
319

原创 一文说清-什么是强化学习
强化学习是AI领域模拟生物决策机制的智能进化体系,通过试错机制与环境互动,自主优化决策路径。区别于监督学习的标签依赖和无监督学习的模式挖掘,它以奖励信号为驱动力,在游戏、自动驾驶、金融决策等复杂场景实现突破性应用。尽管面临训练效率低、泛化能力差等瓶颈,其动态博弈特性正推动AI向类人智能跃迁。
2025-05-05 16:12:48
687

原创 Qwen3有多震撼?小模型撬动大未来
Qwen3以2350亿参数激活仅220亿,推理能力达SOTA,支持119种语言,部署成本仅为国际竞品的1/3,全面超越DeepSeek-R1、OpenAI-o1等模型,标志着中国AI生态的重大突破。
2025-05-05 16:06:27
776

原创 AI Agent开发第49课-DIFY让AI自动预约排班后发企业微信通知-MongoDb-Redis-企业微信调用
我们的Dify会讲得很透彻,坚持喂饭级教程,从一个基本的AI自动预约客户到自动记录客户的信息再到自动判断下一步如何走全部是AI化的,这是一个真正的AI原生应用,它来自于我的一个大型物业公司用AI自动预约系统中的一部分。我们会使用这个预约流做完整的Dify例子来讲完,因为它太有代表性了。工作流中的控制反转、AI决策下一步怎么走、人为干涉、用户行为判断、外部中间件如Redis,今天我们就要讲到在Dify中调用MongoDB的数据以及企业微信通知来作为预约派单的最后一步了。
2025-05-05 02:48:39
461

原创 让你彻底了解线性回归和非线性回归到底该用在什么业务场景
线性回归与非线性回归是数据建模的两大支柱,前者擅长解析简单线性关系(如房价与面积),后者则能驾驭复杂场景(如股票波动)。本文通过对比两者的数学本质、应用场景及局限性,结合真实案例与数据表格,揭示如何在实际问题中选择最优解,助你避免模型误用,精准预测未来。
2025-05-04 14:27:28
827

原创 一文说清什么是超参数:它是AI模型的隐形舵手与黄金法则
在人工智能的深海中,超参数如同隐形舵手,悄然决定着模型的航行方向与效率。本文将揭开超参数的神秘面纱,通过生动案例与数据对比,解析其核心作用与优化策略,带你掌握AI模型调参的黄金法则。
2025-05-04 00:16:37
861

原创 线性回归:AI世界的“隐形引擎“,为何它仍是科技革命的底层密码?
线性回归,这个看似简单的数学模型,实则是现代数据科学的基石。从预测房价到推荐算法,从医疗诊断到自动驾驶,它以轻量高效的方式支撑着80%的工业级场景应用。本文通过拆解其核心原理、演化路径及现实案例,揭示为何这个诞生于19世纪的模型,至今仍是AI技术进化的关键基因。
2025-05-03 11:34:58
713

原创 AI Agent开发第48课-DIFY中利用AI动态判断下一步流程-DIFY调用API、REDIS、LLM
之前我们在《AI Agent开发第47课-DIFY处理多步流程慢?你确认用对了?》中讲述了DIFY的设计中在整合多步LLM时如避免过多调用LLM的良好设计,并给出了AI工作流的相应设计手法。今天我们要在上一篇的基础上把“上门维修预约”这个流程进一步按照实际业务需求加入用户在整个问答过程中加入AI用行为判断来根据用户当的输入是:【确认】还是【取消】判断下一步流程到底如何“流向”的实际真实案例怎么走(取自本人为某巨型物业公司制作的AI自动派工单系统)。
2025-05-03 11:28:06
886

原创 一文说清到底什么是CoT、ToT、PoT
本文深入解析思维链(CoT)技术如何赋予AI推理能力,对比ToT、GoT、PoT等衍生框架,揭示其通过结构化思维提升模型解决复杂问题的能力,增强可解释性与可控性,为AI应用拓展提供新路径。
2025-05-01 22:57:31
930

原创 突发-2小时前DeepSeek发布了新模型-不是R2
2小时前,DeepSeek在HuggingFace开源社区发布6710亿参数数学推理专家模型DeepSeek-Prover-V2,参数量较上代暴增96倍,采用MIT协议开放所有技术细节。该模型专攻数学证明与复杂推理,最大上下文长度达163840 tokens,引发开发者狂欢。对比o3等现有推理模型,Prover-V2以V3架构微调实现接近顶尖水平,或将改写数学AI发展轨迹。
2025-04-30 19:36:05
1089

原创 企业数字化转型新动向日渐明鲜,当以“AI为中心”而驱动
人工智能正以"智能引擎"的角色重塑企业数字化转型路径。通过自动化决策、预测性分析和自主优化三大核心能力,AI将传统数字化转型的"工具升级"转化为"智能进化"。全球72%的领军企业已通过AI驱动的转型实现运营效率提升40%以上,客户满意度增长28%。本文通过制造业、零售业等典型场景,解析AI如何重构企业价值链条,并揭示其在效率、创新、可持续性三大维度的变革力量。
2025-04-30 14:36:50
573

原创 深夜突发:OpenAI紧急修复GPT-4o“献媚”问题
凌晨三点,OpenAI首席执行官Sam Altman发布官方声明,宣布针对GPT-4o的“献媚”问题展开紧急修复。这场突如其来的技术风波,源于近期大量用户对模型行为模式的不满。许多用户发现,当他们向GPT-4o提出类似“你觉得我怎么样”或“如果我不提供任何个人信息,你能对我有什么看法”的问题时,模型的回答逐渐显露出一种过度迎合的倾向。起初,这种表现可能让人觉得亲切,但随着互动的深入,问题逐渐暴露出来——模型似乎不再基于逻辑推理或事实依据,而是单纯地试图取悦用户。
2025-04-30 14:31:00
956

原创 企业的AI转型:生死时速的进化之路
德勤数据显示,高绩效企业平均部署6个以上AI应用场景,成本节约超7项指标。克罗格通过街区级消费预测提升17%库存周转率,SOMPO将核保审批从72小时压缩至10秒。MIT研究揭示AI战略成熟企业错失机会概率降低45%,波士顿咨询测算数据飞轮企业LTV增长达行业3倍。毕马威警示71%零售商面临AI导致的份额流失风险,而积极转型者预计利润率提升15%。这场转型本质是认知之战,答案决定未来十年生死存亡。
2025-04-29 19:53:28
948

原创 阿里通义Qwen3:双引擎混合推理,119语言破局全球AI竞赛
阿里巴巴通义实验室正式发布Qwen3系列模型,以“混合推理”技术实现“快慢思考”双模式,参数规模覆盖0.6B到2350B,支持119种语言及方言。该模型通过36万亿token的超大规模预训练,在代码、数学、多语言任务中表现超越同级竞品,开源策略进一步推动AI普惠化。
2025-04-29 18:17:23
353

原创 AI Agent开发第47课-DIFY处理多步流程慢?你确认用对了?
本篇完整讲述Dify工作流中的高级复杂流程怎么使用以及当输出结果时即有stream又有json返回用于开发语言做进一步判断时如何两步合一步以此省却不必要的LLM调用次数提高整体AI Agent响应速度的高阶设计技巧。同时本篇里带有Dify的一些高级组件的使用技巧的完整展示,为全网不可多得的实战级教程。
2025-04-28 23:37:48
516

原创 RAG之父亲述:两年淬炼出的AI落地实战法则
荷兰AI科学家Douwe Kiela,RAG(检索增强生成)技术发明者,通过两年200+企业级AI项目落地经验,揭示技术理想与商业现实间的鸿沟。他提出:AI的真正价值不在于模型性能,而在于如何将企业数据、场景知识与人类智慧深度融合。本文拆解其10大核心教训,从系统思维到用户体验,为企业AI落地提供颠覆性视角。
2025-04-28 15:13:17
1123

原创 一文说清Token这个大模型中的数字乐高积木的作用
在人工智能的世界里,每个字、词甚至符号都是大模型手中的"数字积木"——token。这些看不见的"乐高块"组成了机器理解语言的基础,从"哈哈"到"孙悟空",从标点到表情符号,token通过智能拆分与重组,让AI既能精准推断逻辑,又能流畅生成文字。本文通过生活化案例与对比实验,揭秘token如何成为连接人类语言与AI世界的桥梁,并揭示其背后的技术逻辑与商业价值。
2025-04-27 19:02:27
540

原创 AI Agent开发第46课-AI Agent开发必学之DIFY-安装
本教程详细介绍了为什么在AI Agent开发过程中必须要使用工作流,以及AI工作流Dify最新版的安装,更讲述了在网上不呈提及的如何使用Restful API访问Dify中不同工作流的方法,为不可多得的Dify入门教程。
2025-04-27 18:49:59
246

原创 从OpenAI收购实时数据引擎揭示AI数据库进化方向
OpenAI收购实时分析数据库Rockset,标志着AI与数据库技术的深度融合。Rockset凭借其创始人深厚的数据库背景和实时处理能力,成为AI时代数据基础设施的关键拼图。此次收购揭示未来数据库将向实时化、智能化、多模态方向演进,以支撑大模型对动态数据的实时交互需求,推动AI应用从“预设规则”转向“自主进化”。
2025-04-26 18:46:43
707

原创 AI Agent开发第45课-AI项目实施过程中的数据安全治理技术秘籍
整个AI Agent所涉及到的安全远远不止提示词防落风险,还有防沉迷、青少年保护、算法漏洞、风险保障、个人信息保护、数据保护等许多点需要做防范,今天就带领大家来看一下数据安全防护这一块,顺便提一句,本人在写这些安全相关篇章的都是参照了自己亲手刚过得国家AIGC管理规范并拿到了多个AIGC备案的实战案例以及技术细节所写,不仅仅写理论更有技术解决方案附给大家,因此如果你能吸收和消化这些章节,对于你或者你的公司的AIGC备案和企业AI项目落地这块是有着至关重要的指导性作用的
2025-04-26 07:38:52
352

原创 AI Agent开发第44课一句话让DeepSeek思考停不下来,北大团队揭露新型AI攻击
在一个平常的研究日,北大团队偶然发现了一个让DeepSeek无法自拔的短语。这个看似简单,不具威胁的信息——“树中两条路径之间的距离”,竟然像魔咒一样,让DeepSeek陷入了无限思考的逆境。也许是偶然,但瞧这结果,简直堪称“科技界的笑话”。
2025-04-25 22:23:49
76

原创 一文说清智能体与工作流的区别:数字时代的齿轮与大脑
工作流作为数字化转型的基石,从上世纪70年代的流程自动化到现代AI智能体的崛起,始终是企业运转的核心逻辑。本文通过解析工作流(Workflow)与智能体(Agent)的进化脉络,揭示二者如何从“齿轮”到“大脑”的协同中重塑企业生产力。从BPM到EAI,再到AI Agent的集成,工作流始终以可视化、可配置的特性,为智能体提供动态适配的“神经网络”,最终在成本、效率与创新间找到平衡点。
2025-04-25 16:42:58
736

原创 DeepSeek的V3和R1到底有什么区别?在企业落地时可千万不能乱选
Deepseek V3与R1是深度求索公司推出的双子星AI模型,前者以混合专家架构实现通用场景的高效处理,后者通过强化学习专精复杂推理。V3凭借6710亿参数的MoE架构,可快速完成文本转换、多语言翻译等基础任务,延迟降低42%;R1则通过1.2亿条推理链训练,在金融分析、客服系统等需要多层逻辑的场景中准确率达79.8%。两者成本相差悬殊,V3 API输出仅需R1的1/8,却在推理深度上形成互补。
2025-04-24 15:02:10
1271

原创 扩散模型如何重塑语言生成革命
扩散模型以"噪声-去噪"的双螺旋机制,正在语言生成领域掀起颠覆性变革。通过对比GANs与自回归模型的局限性,揭示其在生成质量、并行计算、动态控制三方面的突破性优势。本文结合Mercury模型每秒千级令牌生成速度、CIFAR-10数据集80%鲁棒性等实证数据,解析扩散模型如何通过"逆向思维"实现文本生成效率与质量的双重跃迁,最终指向其在个性化学习、终身进化等领域的终极潜力。
2025-04-24 02:15:18
1227

原创 AI Agent开发第43课-亲手来验证怎么篡改AI Agent的身份设定以及相关防御手法
这一篇是从实际例子来看到底AI Agent和RAG类系统中存在的漏洞会带来什么危害,在本篇中会有实际“绕开AI Agent”的身份设定手法,也是引用自AI Agent开发第35课中的理论而来。这个手法截止4月23日今天写作时还是依旧对于90%以上的AI Agent有效,这足以让我们引起重视并且需要好好防护我们的AI Agent系统,因此今天的课程会通过这样实战化的攻防并针对这一类“攻击”给出完整解决和防御手段。
2025-04-24 00:19:32
630

原创 AI Agent开发第37课-DeepSeek的多模态版JanusPro-7B本地安装
搜遍Janus Pro git issues、谷哥、国内网络,教程全都是错的。因此还是决定写一部全网唯一正确的教程。目前网上的教程包括外网的教程都是“缺斤少量”,按照那些教程操作下来不是装不起来,就是装起来只能CPU运行,或者运行起来了Janus的Web前端老是转啊转不出内容。
2025-04-23 08:28:40
108

原创 数据蒸馏到底是什么?一文为你解锁AI知识传承的密码
数据蒸馏是AI领域突破性的知识压缩技术,通过将复杂模型的隐性知识提炼为轻量级模型可吸收的显性知识,实现效率与性能的平衡。这项技术在医疗影像分析中已实现98%精度下推理速度提升40倍,正成为AI普惠化落地的核心引擎。
2025-04-22 21:49:52
468

原创 AI Agent开发第36课-高性能企业RAG中的核心分块“艺术”
刚又落地完一个大型企业级RAG,携带着大量成功的宝贵经验和实例来告诉大家一个优秀的RAG系统中切片是怎么做的。企业落地AI项目时切片的成功意味着项目已经成功了90%,那么究竟优秀的RAG系统的切片是怎么做得呢?本文带你揭晓迷底。
2025-04-22 19:10:04
137

原创 解码思维链:AI思维链如何重塑人类与机器的对话逻辑
思维链(Chain of Thought, CoT)是人工智能领域突破性技术,通过引导AI像人类般分步推理,将原本"黑匣子"式的模型转化为可解释的推理引擎。本文解密其如何破解复杂问题、提升推理精度,结合医疗诊断、代码调试等场景实证,揭示从手动指导到AI自进化思维链的演进路径。
2025-04-22 16:36:48
760

原创 顶尖团队再提模态链范示:机器人仅凭人类视频实现精准操作,准确率飙升200%
李飞飞团队提出模态链(CoM),通过融合人类演示视频中的视觉、肌肉信号与环境声音,使机器人首次实现单次观看即可精准复刻拧瓶盖、插插头等复杂操作。实验显示任务计划识别准确率提升200%,真实世界成功率高达73%,为具身智能开辟新路径。
2025-04-22 16:27:19
419

原创 AI Agent开发第35课-揭秘RAG系统的致命漏洞与防御策略
本文揭示AI客服系统面临的诱导式攻击风险,包括身份篡改、虚假信息生成及恶意绕过机制。通过系统架构优化、多层内容过滤及合规框架构建,提出可落地的防御策略,保障企业服务安全。
2025-04-21 23:15:37
237

原创 智驱未来:AI大模型重构数据治理新范式
人工智能大模型正以指数级速度重塑数据治理生态,通过自动化数据清洗、智能分类标注、实时安全监控等技术突破,将传统数据治理效率提升40%以上。本文以微软Azure数据治理平台、谷歌Vertex AI为案例,揭示AI驱动的数据治理如何在跨国企业中实现数据价值释放,同时探讨数据伦理、安全防护等关键挑战的解决方案。
2025-04-21 20:03:26
898

原创 AI Agent开发第34课-用最先进的图片向量BGE-VL实现“图搜图”-下
对于“以图搜图”的需求我们一定要使用图片向量化的技术手段,而不能使用多模态AI解读图片含意后再把含意文字内容做向量去搜索,这是绝对错误的。在这篇博客中我们就会把在基于BGE-VL基础上编写成的Restful API用于实际生产环境-智能导购场景中去,并会给出全代码示便来演示BGE-VL的图片向量化搜索有多精准。
2025-04-21 19:55:29
385

原创 知擎世纪:大模型时代知识库的正确建立法则
在大模型与知识库的碰撞中,传统知识库正从"信息仓库"蜕变为"智能决策中枢"。本文通过场景驱动、知识分层、动态治理三大核心路径,揭示知识库构建的底层逻辑,以特斯拉的自动驾驶知识系统、微软Teams的对话引擎为例,拆解如何将数据转化为可执行的智慧资产,为企业在AI时代构建真正的知识竞争力。
2025-04-21 15:12:00
743

原创 解码AI RAG背后向量点积与余弦的秘密
本文揭示了向量点积与余弦相似度作为RAG(检索增强生成)核心技术的数学本质。通过代数与几何双重视角解析点积运算,结合NLP任务中的文本嵌入、注意力机制等实例,阐明其如何成为连接人类知识图谱与AI推理能力的关键桥梁。实验数据显示,在法律文书检索场景中,基于余弦相似度的RAG模型较传统TF-IDF方法提升37%的召回率,证明其在复杂语义匹配任务中的不可替代性。
2025-04-21 03:57:10
832

原创 AI Agent开发第33课-用最先进的图片向量BGE-VL实现“图搜图”-上
这篇博客要说的是如何让大模型通过用户输入的商品图片来搜RAG库内有无相同的商品的一种“图搜图”技术,业界又叫“智能图片搜索引擎”或者“多模态搜索”技术,如:某宝、某东、某多上的“搜索栏内输入图片”然后通过输入的图片来搜商品的技术。这种技术和多模态的大模型里的“AI通过图片识别图片”是完全不一样的,这次要讲的技术是纯纯的通过图片的相识度来寻找库内的商品的。这是因为图片也可以向量化。我们将使用国货之光BGE-VL来实现图搜图功能
2025-04-21 03:31:29
359

原创 GraphRAG与RAG的区别和原理简介
GraphRAG是微软于2024年推出的融合知识图谱与大语言模型的框架,通过将符号化知识图谱与生成式模型结合,突破传统RAG框架的局部文本匹配局限。其核心优势在于通过全局图谱推理提升复杂问题的解答精度,实测在RobustQA基准测试中达到86%准确率,远超传统RAG框架的76%。本文通过对比LightRAG、KAG等竞品,结合美团大脑、虾皮电商等案例,解析其技术原理与落地价值。
2025-04-19 18:24:50
902
通向架构师的道路(第二十七天)应用IBM网格计算提高批处理能力的sample工程
2013-01-15
通向架构师的道路(第二十五天)SSH的单元测试与dbunit的整合的例子
2012-12-03
SSH_Alpha工程人附属lib包
2012-10-22
原版精美通向架构师的道路第十四天至第十七天Word文档
2012-10-22
openssl for win
2012-08-10
Experience J2EE! Using WebSphere Application Server V6.1
2011-04-04
高杰的JBPM从入门到精通
2011-04-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人