大模型必读系列
文章平均质量分 92
YaoAIPro
初级AI探索者
展开
-
AI Agent架构:探索新兴的代理式AI体系
然而,随着函数调用技术的发展,AI代理现在可以生成结构化的、可操作的输出。当前,有大量研究探讨了AI代理的未来,但这些代理的设计和开发实际上基于一些切实可行的架构和技术,这些架构成为了这些AI代理得以自主适应、动态行动的基础。比如,一个用于客户服务的AI代理可能包含一个擅长自然语言理解的小型模型,另一个专注于检索数据库的模型,还有一个模型可以用来处理用户的个性化需求。从大型动作模型到视觉语言的整合,再到函数调用的普及,AI代理已经不再只是静态的工具,它们是可以主动探索、学习并与环境互动的系统。原创 2024-10-07 22:30:08 · 862 阅读 · 0 评论 -
大模型必读系列01-2:BERT模型复现-tensorflow版
在篇文章中,笔者对BERT的文献进行了总结,而在这一章节中,笔者将对BERT模型进行复现。Google团队发布的BERT源代码是基于TensorFlow 1.x版本,而笔者跟随前沿的技术架构,因此选择使用TensorFlow 2.10.0进行复现。由于TensorFlow 2.x版本的API发生了很大的变动,想要成功运行官方源码需要进行大量的修改,这确实是一个相当痛苦的过程。在安装TensorFlow-GPU之前,有必要先了解它与Python、CUDA和cuDNN的版本对应关系。原创 2024-09-20 10:49:15 · 1071 阅读 · 0 评论 -
大模型必读系列01:BERT精读笔记
文章介绍了一种新型的语言表示模型**BERT**(Bidirectional Encoder Representations from Transformers,基于Transformer的双向编码器表示)。BERT旨在通过在所有层中同时考虑左右两侧的上下文信息,对未标记的文本进行深度双向预训练表示。因此,预训练的BERT模型可以通过一个额外的输出层对特定的任务进行微调,无需对架构进行大量修改就能提高模型性能。结果显示,BERT在11个NLP任务上都获得了最先进的结果。原创 2024-09-07 22:49:21 · 930 阅读 · 0 评论