AI RAG的知识满天飞，为什么你还做不出一个像样的AI助手应用

最新推荐文章于 2024-11-01 17:13:19 发布

置顶 TGITCIC

最新推荐文章于 2024-11-01 17:13:19 发布

阅读量976

点赞数 17

分类专栏： AI-大模型的落地之道文章标签：人工智能 AIGC llama gpt AI编程 AI-native

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lifetragedy/article/details/139292085

版权

AI-大模型的落地之道专栏收录该内容

45 篇文章 6 订阅

订阅专栏

引言

在过去的一年半里，随着大型语言模型（LLM）的崛起，检索增强生成（RAG）的概念也逐渐进入公众视野。

从微信公众号到各大自媒体，关于RAG的讨论几乎无处不在。然而，尽管这些高科技名词让人眼花缭乱，真正能够落地成为企业级项目的案例却寥寥无几。

这不禁让人产生疑问：RAG真的有用吗？LLM真的可以落地吗？

真的领会到了RAG的精髓了吗

当前，学习AI的热潮中，许多人更倾向于关注理论学习和概念炒作，而忽视了实际操作的重要性。与其天天浏览各种概念的软文，不如亲自投身于一个项目，从头到尾实现一个RAG引擎。

这样做的好处显而易见：

首先，可以深入理解RAG的数据流和处理机制；

其次，可以详细了解不同LLM的特性；

最重要的是，可以亲身体验到，一个优秀的LLM在实际应用中需要关注的不仅仅是其外在的华丽演示，更重要的是其响应速度、准确性和成本效益。

RAG引擎的精髓

在我现在这个Studio里，我们的AI Agent遵循一个原则：切实为企业解决实际问题，提升生产力，让每个企业都能用得起AI。

我们的AI AGENT可以用三个字概括：快、准、省。

我们提出的RAG标准为：

响应时间在5秒内；
幻觉消除率达到99%；
单次会话成本控制在1,000Token以内，带图文的会话则控制在1,400-2,000Token内；

有幸的是我们也看到了业界的相关标准逐步正在往快、准、省方面发展。犹记得我前几篇博文中提到 “企业要实施建议走MAAS化道路”，同时Token收费要便宜，1,000 Token必须控制在1毛2-1行4间。刚写完没2周，整体业界的Token收费开始大规模降价，甚至GPT也降了50%以上，GPT3.5更是不要钱随便次数调了。

这的确是一件好事，也有利于AI Agent市场的落地。

当前RAG类项目落地依旧面临挑战以及如何破局

尽管AI的落地看似光鲜，实际上仍面临着三大挑战。

第一大挑战：技术鸿沟是一个不容忽视的问题

这需要技术人员在市场上进行持续的教育和推广。

第二大挑战：由于LLM/AI领域的新颖性，缺乏可供参考的先例

技术工作者需要不断探索和实验，在实践中顽强摸索前进，每个AI领域的技术工作者要有争做领路人的精神，要敢于做第一个“吃螃蟹”的人。

第三大挑战：如何说服企业采用AI而不是传统的人工方式？

解决之道在于展示AI能够用更少的人力完成更多的工作，而且质量更高、效率更快。

总结

在这个快速发展的时代，我们需要彻底了解一个行业或企业内部的业务流程，这通常依赖于少数技术和业务骨干。因此如何将这些核心知识转化给AI，把这些骨干的全部业务知识哪怕90%可以搬到AI身上这是值得每一个落地者需要去深思的一个问题！这个问题很难但是它绝对是值得去做的一件事，因为只有这样做才能更好的把一家企业的核心竞争力尽大化的保留住并行成“知识传承”，这也是良性的企业运作模式。我们一定需要不断的去考虑如何：让AI成为一个真正可用的协作伙伴，而不仅仅是一个华而不实的展示品，这是我们未来需要解决的关键问题。

关注

17
点赞
踩
21

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

TGITCIC

CSDN认证博客专家 CSDN认证企业博客

码龄22年

Java领域优质创作者

337: 原创

2987: 周排名

783: 总排名

331万+: 访问

: 等级

2万+: 积分

1万+: 粉丝

3626: 获赞

2785: 评论

2924: 收藏

私信

关注

热门文章

分类专栏

最新评论

Android入门第69天-AndroidStudio中的Gradle使用国内镜像最强教程
007小白: 好吧，幸好不用一直建项目
Android入门第69天-AndroidStudio中的Gradle使用国内镜像最强教程
TGITCIC: 你应该用jekins来构建，这样就可以读入环境变量设置，真正开发不会用as这样直接build的，自己开发连着as的真机模拟即可
Android入门第69天-AndroidStudio中的Gradle使用国内镜像最强教程
007小白: 大佬，问一下distributionUrl这个变量每次构建新项目都需要改，有没有什么办法一次修改，永久生效？
详解Redis分布式锁在SpringBoot的@Async方法中没锁住的坑
TGITCIC: 我get到你的点了，你指的是查询这把锁是不是被锁，唉。。。我懂了。。。这个地方我告诉你一下，你不要伤心。。。网上几乎所有教程都我没改前的写法，锁时看一下，能不能锁。我明确告诉你们，你们都被误导了。看清了，这个用的是redisson锁，这是因为redisson有自续约锁。而最早出现的锁是jedis锁，因此呢。。。后来在2017，18年左右有一个人把jedis写法套到了redisson上。可是可以。。。但是呢，这会导致这么一个问题： 1. 我如果在GET时再看锁有没有被占用，这时在写法上就很尴尬 2. 其次这种做法是在耗CPU，对是耗CPU底层哦而，我用锁状态首先不是空+这么锁状态锁上了，那么这个条件成立直接就return掉了就不处理了此时按照自己特有的业务逻辑告诉别人：请等待或者是有任务在处理中对吧？这得多剩开效。所以。。。所有人一个是被之前最早那个锁教程给误导了都写成lock时才判断锁状态。而redisonn早把这种陋习改了，这多优雅。。。能进IF必然可用，不然。。。一个RETURN出去。锁时就该锁不要做额外的操作。代码写起来也舒服，对不？
详解Redis分布式锁在SpringBoot的@Async方法中没锁住的坑
m0_49393215: 查询方法的上锁逻辑改完跟导出方法的上锁逻辑没改之前一样吧，求解

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

TGITCIC 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。