Agent 可以用来做数据分析吗

最新推荐文章于 2025-04-17 23:09:38 发布

AI程序猿人

最新推荐文章于 2025-04-17 23:09:38 发布

阅读量1k

点赞数 9

文章标签：数据分析数据挖掘人工智能 ai大模型大语言模型 LLM Agent

本文链接：https://blog.csdn.net/python1222_/article/details/140435302

版权

之前在大模型时代，Databricks 向左，Snowflake 向右这篇文章中，分析了一下大模型数据分析的一些路径。在这里面，openai 是直接采用大模型+code interpreter 模型来做数据分析，带来了新的想象力

但是 openai 的一些例子还存在很多不稳定和明显的分析上的缺陷。例如缺乏直接读取处理原始数据、缺乏交互式探索、不能做大规模数据处理等

最近 Agent 作为大模型的一个能力有了很多应用。作为一个针对特定场景，做决策和执行的智能体。Agent 是不是也可以用作数据分析呢？

LlamaIndex 的 CEO 写了一篇文章，Data Agents，并且 LlamaIndex 也推出了相应的服务。对 Agent 在数据分析类的场景做了抽象和尝试。

核心的组件抽象成两个：

推理循环(reasoning loop)
工具(Tool abstractions)

基本的流程就是，通过推理循环拆解任务，通过调用 tools 做具体分析动作。中间过程出现在"Conversation History“里面

Data agent 对工具也做了很多分类，例如直接查询、加载查询等

在文章最后的总结，有一个问题挺有意思：

应该用 Data agent 来做查询和召回，还是继续用查询引擎?

答：两者都有可能。查询引擎使您能够以受约束的推理方式和不受约束的方式定义自己的数据工作流程。默认情况下，agent不受约束，理论上可以对您提供的任何工具集进行推理。这意味着您可以获得开箱即用的高级搜索/检索功能 - 例如，在我们的例子中，我们展示了您只需通过 text2sql工具就可以实现 SQL查询。但另一方面，以这种方式构建的agent可能非常不可靠

开箱即用的灵活。但是如果采用 text2sql 可能会不可靠。LlamaIndex 还是立足于 RAG 这个技术路径，Agent 是作为 RAG 的增强。他并不喜欢 text2sql，也认为 text2sql 不可靠

Agent 作为更高一层的抽象，可以基于 Tools 来形成数据分析的过程。Tool 可以是 RAG 、也可以是SQL，甚至是可执行环境(例如python runtime)等等。Agent 用来进行交互式探索

实际的数据分析，尤其是交互式数据分析比 LlamaIndex 总结的要复杂的多。微软的 TaskWeaver 项目是这样总结的：

用户提出查询需求之后，大模型把任务分解成子任务。子任务通过 Code Interpreter 执行环境执行后返回。这中间还需要通过 Memory 同步执行结果

如果这个过程能够实现，那用自然语言直接做数据分析就指日可待了。但是这之前还有挺多的是要完成。一个是多轮交互分析，还有就是大数据量情况下的性能问题

这方面的技术创新还在进行，期待在 2024 年能够有更大的进进展

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述