
LLM工业级落地实践
文章平均质量分 96
本专栏主要讲解:LLM的实际业务落地实践,应用方面包含NL2DSL(NL2SQL、NL2GQL)、AI智能分析、智能生成报告、AI Agent等;包含技术原理,技术选型,工业级技术方案,落地实践教学等,将会逐步更新。
优惠券已抵扣
余额抵扣
还需支付
¥359.90
¥399.90
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
汀、人工智能
本博客将不定期更新关于机器学习、强化学习、数据挖掘以及NLP等领域相关知识,以及分享自己学习到的知识技能,感谢大家关注!
展开
-
LoRA及其变体:大模型微调技术的最新发展与应用
LoRA及其变体:大模型微调技术的最新发展与应用原创 2025-04-30 11:00:00 · 9 阅读 · 0 评论 -
强化学习在NLP任务中的迁移应用:分类与开放式问答的显著提升
强化学习在NLP任务中的迁移应用:分类与开放式问答的显著提升原创 2025-04-29 11:00:00 · 18 阅读 · 0 评论 -
Deep ReSearch实战:以Jina项目解构京东外卖战略的深层逻辑
Deep ReSearch实战:以Jina项目解构京东外卖战略的深层逻辑原创 2025-04-28 11:00:00 · 249 阅读 · 0 评论 -
从Search到Deep ReSearch:解析现代搜索模型的任务分解与执行策略
从Search到Deep ReSearch:解析现代搜索模型的任务分解与执行策略原创 2025-04-28 11:00:00 · 122 阅读 · 0 评论 -
深度解析:透过十问十答洞悉大模型SFT的应用策略
深度解析:透过十问十答洞悉大模型SFT的应用策略原创 2025-04-23 11:45:00 · 119 阅读 · 0 评论 -
Dify vs n8n vs RAGFlow:2025年AI应用与自动化工作流平台的终极对决
Dify vs n8n vs RAGFlow:2025年AI应用与自动化工作流平台的终极对决原创 2025-04-17 11:41:42 · 692 阅读 · 0 评论 -
Dify Agent 驱动轻量级 MCPserver:联动 Zapier 实现智能搜索高效数据流转
Dify Agent 驱动轻量级 MCPserver:联动 Zapier 实现智能搜索高效数据流转原创 2025-04-09 20:16:39 · 183 阅读 · 0 评论 -
如何提升RAG系统整体效果:从索引构建-问句理解-混合搜索+语义排序着手,评估系统
一个主要的问题是, query 的 embedding 与文档的 embedding 在向量空间并没有对齐。改善这种情况的常见方法是从文档中提取信息并用它来回答问题。可以对文档提取、总结和生成潜在问题以改进的 embedding 匹配的问题。从单一的文档 chunk 生成了 keywords,topics,HyDE 和 summary,这些信息可以极大的提高检索的效果。原创 2025-01-07 19:50:07 · 486 阅读 · 0 评论 -
RAG分块策略:主流方法(递归、jina-seg)+前沿推荐(Meta-chunking、Late chunking、SLM-SFT)
RAG分块策略:主流方法(递归、jina-seg)+前沿推荐(Meta-chunking、Late chunking、SLM-SFT)原创 2024-12-11 07:00:00 · 345 阅读 · 0 评论 -
AI Agent智能体全景技术图与架构设计:智能体自主性与智能性的双重提升
AI Agent智能体全景技术图与架构设计:智能体自主性与智能性的双重提升原创 2024-11-29 07:00:00 · 474 阅读 · 1 评论 -
全面解析LLM业务落地:RAG技术的创新应用、ReAct的智能化实践及基于业务场景的评估框架设计
全面解析LLM业务落地:RAG技术的创新应用、ReAct的智能化实践及基于业务场景的评估框架设计原创 2024-11-28 17:03:58 · 478 阅读 · 0 评论 -
GraphRAG、Naive RAG框架总结主流框架推荐(共23个):LightRAG、nano-GraphRAG、Fast-GraphRAG、Dify、RAGflow等
GraphRAG、Naive RAG框架总结主流框架推荐(共23个):LightRAG、nano-GraphRAG、Fast-GraphRAG、Dify、RAGflow等原创 2024-11-28 07:00:00 · 1660 阅读 · 0 评论 -
RAG系统高效检索提升秘籍:如何精准选择BGE智源、GTE阿里与Jina等的嵌入与精排模型的完美搭配
RAG系统高效检索提升秘籍:如何精准选择BGE智源、GTE阿里与Jina等的嵌入与精排模型的完美搭配原创 2024-11-17 15:06:01 · 204 阅读 · 0 评论 -
高级RAG技术:提升生成式AI系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
高级RAG技术:提升生成式AI系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】原创 2024-10-26 21:26:10 · 1045 阅读 · 0 评论 -
基于Dify项目实践,翻译含提示词
基于Dify实现--多Agent协作系列:三步翻译法,把翻译这件“小事”做好原创 2024-10-25 21:19:06 · 894 阅读 · 0 评论 -
NL2SQL商业案例详解:AI智能开放搜索 OpenSearch
NL2SQL商业案例详解:AI智能开放搜索 OpenSearch原创 2024-10-09 07:00:00 · 667 阅读 · 0 评论 -
Dify实现text2sql工作流[SQL调用篇],并查询Postgres数据库 or Mysql数据库(docker容器)
Dify实现text2sql工作流[SQL调用篇],并查询Postgres数据库 or Mysql数据库(docker容器)原创 2024-10-09 07:00:00 · 8594 阅读 · 0 评论 -
LLM大模型部署实战指南
LLM大模型部署实战指南:Ollama部署简化流程,OpenLLM灵活部署,LocalAI本地优化,Dify赋能应用开发【含ollama详细部署指南多版本】原创 2024-10-08 12:04:14 · 742 阅读 · 0 评论 -
NL2SQL之DB-GPT-Hub<详解篇>:text2sql任务的微调框架和基准对比
NL2SQL之DB-GPT-Hub:text2sql任务的微调框架和基准对比原创 2024-10-08 11:23:32 · 862 阅读 · 0 评论 -
RAG+Agent人工智能平台:RAGflow实现GraphRAG知识库问答,打造极致多模态问答与AI编排流体验
RAG+Agent人工智能平台:RAGflow实现GraphRA知识库问答,打造极致多模态问答与AI编排流体验原创 2024-09-20 11:38:13 · 3233 阅读 · 0 评论 -
FastGPT一站式解决方案[2-应用篇]:轻松实现RAG-智能问答系统,AI工作流、核心模块讲解
FastGPT一站式解决方案[2-应用篇]:轻松实现RAG-智能问答系统,AI工作流、核心模块讲解原创 2024-09-17 07:00:00 · 524 阅读 · 0 评论 -
基于AgentUniverse在金融场景中的多智能体应用探索【极客传媒】
基于AgentUniverse在金融场景中的多智能体应用探索原创 2024-09-16 07:00:00 · 574 阅读 · 0 评论 -
面向个小微型企业的开源大模型(Qwen2等)商业化, AI部署成本分析与优化策略(费用分析、资源消耗分析)
面向个小微型企业的开源大模型(Qwen2等)商业化, AI部署成本分析与优化策略(费用分析、资源消耗分析)原创 2024-09-12 07:00:00 · 767 阅读 · 0 评论 -
FastGPT一站式解决方案[1-部署篇]:轻松实现RAG-智能问答系统(含sealos云端部署、docker部署、OneAPI&Xinference模型接入)
FastGPT一站式解决方案[1-部署篇]:轻松实现RAG-智能问答系统(含sealos云端部署、docker部署、OneAPI&Xinference模型接入)原创 2024-09-11 07:00:00 · 636 阅读 · 0 评论 -
从数据洞察到智能决策:合合信息&infiniflow RAG技术的实战案例分享
从数据洞察到智能决策:合合信息&infiniflow RAG技术的实战案例分享原创 2024-09-11 07:00:00 · 417 阅读 · 0 评论 -
RAG+Agent在实际业务落地案例分享+项目推荐【极客传媒】
RAG+Agent在实际业务落地案例分享+项目推RAG+Agent在实际业务落地案例分享+项目推荐荐原创 2024-09-10 07:00:00 · 803 阅读 · 0 评论 -
从传统RAG到Graph RAG:知识图谱技术驱动下的链路转型与融合策略[DB-GPT、OpenSPG、Tugraph三合一]
从传统RAG到Graph RAG:知识图谱技术驱动下的链路转型与融合策略原创 2024-09-10 07:00:00 · 769 阅读 · 0 评论 -
万字精研:大型语言模型微调Fine-Tuning技术——14种主流方法的原理、适用场景及实践指南
万字精研:大型语言模型微调Fine-Tuning技术——14种主流方法的原理、适用场景及实践指南原创 2024-09-05 07:00:00 · 1063 阅读 · 0 评论 -
RAG技术全栈进化解析:RAG技术升级、评估度量指标、应用场景、生态总结、落地实践问题解决、垂直场景应用、多模态RAG探索(✨)
RAG技术全栈进化解析:RAG技术升级、评估度量指标、应用场景、生态总结、落地实践问题解决、垂直场景应用、多模态RAG探索(✨)原创 2024-09-04 07:30:00 · 1478 阅读 · 0 评论 -
RAG理论到实践:高级、模块化RAG在AI工程架构中的行业通用解决方案与实施策略(Advanced RAG✨)
RAG理论到实践:高级、模块化RAG在AI工程架构中的行业通用解决方案与实施策略(Advanced RAG✨)原创 2024-09-04 07:30:00 · 706 阅读 · 0 评论 -
RAG模型效果优化全攻略:多维度策略优化RAG模型性能的关键技术与方法(RAG优化)
RAG模型效果优化全攻略:多维度策略优化RAG模型性能的关键技术与方法(RAG优化)原创 2024-09-02 07:00:00 · 916 阅读 · 0 评论 -
大模型知识检索RAG业务实践实践(高级篇)
大模型知识检索RAG业务实践实践(高级篇)原创 2024-08-31 07:00:00 · 4273 阅读 · 0 评论 -
大模型知识检索RAG业务实践实践(技术详解篇)
大模型知识检索RAG业务实践实践(技术详解篇)原创 2024-08-31 07:15:00 · 3783 阅读 · 0 评论 -
大模型知识检索RAG业务实践实践(初级篇)
大模型知识检索RAG业务实践实践(初级篇)原创 2024-08-30 07:00:00 · 339 阅读 · 0 评论 -
LLM大模型部署实战指南
Ollama 是一个开源框架,专为在本地机器上便捷部署和运行大型语言模型(LLM)而设计。,这是 Ollama 的官网地址:https://ollama.com/原创 2024-10-26 07:00:00 · 395 阅读 · 0 评论 -
创新互动体验RAG:利用角色化AI技术增强影视评论的沉浸感
创新互动体验RAG:利用角色化AI技术增强影视评论的沉浸感原创 2024-08-29 07:00:00 · 557 阅读 · 0 评论 -
RAG理论到实践:高级、模块化RAG在AI工程架构中的行业通用解决方案与实施策略(Advanced RAG✨)
RAG理论到实践:高级、模块化RAG在AI工程架构中的行业通用解决方案与实施策略(Advanced RAG✨)原创 2024-08-28 07:15:00 · 462 阅读 · 0 评论 -
模块化RAG技术路线图(Modular RAG Technical Map):从基础Naive RAG 到高级Advanced,再到Modular RAG全方位技术解读
模块化RAG技术路线图(Modular RAG Technical Map):从基础Naive RAG 到高级Advanced,再到Modular RAG全方位技术解读原创 2024-08-27 07:30:00 · 983 阅读 · 0 评论 -
打造高效精准的RAG系统:构建智能知识切分降噪体系,强化Query改写与意图抽取能力、精细化提升数据召回策略和后置处理技术
打造高效精准的RAG系统:构建智能知识切分降噪体系,强化Query改写与意图抽取能力、精细化提升数据召回策略和后置处理技术原创 2024-08-27 07:30:00 · 651 阅读 · 0 评论 -
深度解读RAG技术发展历程:从基础Naive RAG 到高级Advanced,再到模块化Modular RAG的全面升级
深度解读RAG技术发展历程:从基础Naive RAG 到高级Advanced,再到模块化Modular RAG的全面升级原创 2024-08-26 14:44:45 · 775 阅读 · 0 评论