【大模型入门】什么是向量、向量数据库?

问题 发明”苹果“这个词之前, 人们如何描述苹果呢?

通过描述 颜色 大小 形状 纹理 特征等, 可以对苹果 清晰的定义

将这些特征用数字描述 得到一个数组 即 “向量” image.png

这样 复杂的图形 变成了数字 计算机就可以识别了

新的苹果出现 计算机仍然可以认识苹果吗

即使出现新的苹果 这些苹果在向量数据库中 离的很近 相似度很高

image.png

AI大模型 + 向量数据库

当今的人工智能 通过上千个维度 来学习 训练 大模型 当AI大模型遇到庞大的向量数据库

大模型如何学习的?

step1向量数据

喂给大模型的词汇 都会先转换成 向量数据

image.png

当训练数据中出现多组类似的语言时 在向量数据组成的高维空间 相近的词汇就会离的更近 大语言模型就可以逐渐捕捉到 词汇间的语义和语法

image.png

比如大模型 会很明白 苹果 西瓜的语义上接近 但是和公交车 相差甚远

image.png

step2 大模型需要对上下文进行理解

此时transfermer架构开始发挥作用 从每个词出发 观察和其他词之间的关系权重

image.png

例如一句话中[“我” ”昨天“ ”买的“ ”苹果“ ”很好吃“],

很好吃 和 我的关系权重最大

这个很好吃 和 我 权重结果 被当作新的维度记录下来

这样一句话 也转换成了 带权重的向量 image.png

step3 问答

语言模型 经过 查询 计算 生成权重最高的答案输出给你 一次问答就完成了

image.png

总结

实际上大模型推理的过程更为复杂, 需要处理文本 图像 音视频 等大量非结构化数据 并 转换为 向量数据进行学习 这些数据的向量维度高达上千

传统数据库 只能进行行 列 检索

向量数据库 将向量数据组成一个 立体高维空间, 在空间中进行模糊检索 能够快速输出权重最高的答案

什么是向量数据库

image.png

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

  • 18
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
当然可以!以下是一个简单的向量数据库教程: ## 向量数据库入门教程 ### 什么是向量数据库向量数据库是一种专门用于存储和检索高维向量数据的数据库系统。它与传统的关系型数据库和文档型数据库不同,主要针对非结构化的高维向量数据进行存储和查询。 ### 为什么需要向量数据库? 在许多应用场景中,如图像搜索、推荐系统、人脸识别、自然语言处理等,我们需要处理大规模的高维向量数据。传统的数据库系统无法高效地存储和查询这些数据,而向量数据库则提供了专门的解决方案。 ### 向量数据库的特点 1. 高维向量存储:向量数据库能够存储大规模的高维向量数据,支持快速插入和查询操作。 2. 向量索引:为了加速向量之间的相似度计算和查询操作,向量数据库采用特殊的索引结构,如倒排索引、kd-tree、球树等。 3. 相似度搜索:向量数据库能够基于向量之间的相似度进行快速搜索,找到与给定查询向量最相似的数据项。 4. 高性能计算:为了支持高效的向量相似度计算和查询操作,向量数据库提供并行计算和优化算法。 5. 扩展性:向量数据库能够处理大规模的数据集,并支持水平扩展以满足存储需求的增长。 ### 向量数据库的使用步骤 使用向量数据库通常包括以下步骤: 1. 数据准备:首先,将要存储的向量数据准备好,并确定每个向量的维度。 2. 数据建模:根据应用需求,设计合适的数据模型来表示向量数据。可以使用向量库提供的 API 或工具,将向量数据导入到数据库中。 3. 向量索引:为了加速查询操作,需要为向量数据构建索引。根据数据库的特性,选择合适的索引结构并进行索引构建。 4. 相似度搜索:根据具体的查询需求,使用查询接口或工具,在数据库中执行相似度搜索操作。根据相似度计算方法,找到与查询向量最相似的数据项。 5. 数据更新:当有新的向量数据需要添加或更新时,使用数据库提供的接口或工具进行数据更新操作。 ### 常见的向量数据库 目前,有许多开源和商业的向量数据库可供选择。以下是一些常见的向量数据库: - [Milvus](https://milvus.io/):由 CSDN 开发,基于 Faiss 和 TensorFlow 构建的开源向量数据库。 - [ANN-Benchmarks](https://github.com/erikbern/ann-benchmarks):一个用于评估向量数据库性能的开源项目,提供了多种流行的向量数据库实现。 - [Elasticsearch](https://www.elastic.co/elasticsearch/):一个开源的分布式搜索和分析引擎,***
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值