【大语言模型】如何让ChatGPT等LLM拥有记忆

我们现在在跟ChatGPT等生成式人工智能聊天时,都需要我们给定一个上下文,生成式AI才会根据我们问题结合上下文给出回答,他们并没有任何记忆。想象一下未来我们有一个AI机器人在我们的身边,每天它的记忆都会归零,你必须跟它解释下过去发生了什么是多么痛苦的一件事。

这个问题需要引入Vector Database来解决,将向量数据库作为大型语言模型(LLM)如GPT-3或BERT的长期记忆使用是一种增强其功能的策略,特别适用于需要知识保留、上下文管理和从新信息中动态学习的任务。这种概念涉及利用向量数据库来存储和检索上下文和事实信息,这些信息可以在对话或任务中由LLM动态使用。

向量数据库是一种专门用于存储、索引和管理由机器学习模型生成的数据向量嵌入的数据库。这些向量嵌入是数据项(如文本、图像或声音)的高维表示,能够捕获它们的内容或特征的某些方面,以便计算机能够处理。这些嵌入通常由自然语言处理(NLP)或图像识别等现代AI模型生成。

向量数据库的关键特性

1. 高维索引:
向量数据库针对高维数据进行了优化,这些数据是许多现代AI模型的输出。与传统数据库可能难以处理维度的诅咒不同,向量数据库使用复杂的索引技术有效地在高维空间中进行查询。

2. 相似性搜索:
向量数据库的一个主要功能是执行相似性或接近性搜索。它们可以根据距离度量(如欧几里得距离、余弦相似度或曼哈顿距离)快速找到与给定查询向量最接近的向量。这对推荐系统、搜索引擎和异常检测等应用至关重要。

3. 可扩展性:
这些数据库旨在随着数据大小和维度的增长而扩展,能够处理数百万甚至数十亿个向量。

下面是一些常见的Vector Database:

如果大家感兴趣,我会在后面的文章详细讲解Vector的原理,给我留言。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Thinking in Stock

您的鼓励是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值