大模型学习路线(2)——数据工程(数据预处理)

目录

前言

一、数据工程(Data Engine)

二、Token分词/Tokenizer

三、提示工程

四、向量数据库


前言

该思维导图参考自ZOMI酱的B站视频整理而来,数据预处理/数据工程全栈式的思维导图如下:

视频链接1:ZOMI酱的个人空间-ZOMI酱个人主页-哔哩哔哩视频 (bilibili.com)

视频链接2:向量数据库介绍,Vector和Embedding关系 #大模型 #向量数据库_哔哩哔哩_bilibili


一、数据工程(Data Engine)

(待更......)

二、Token分词/Tokenizer

Tokenizer部分直接看此链接足矣:大模型基础组件 - Tokenizer - 知乎 (zhihu.com)

三、提示工程

(待更......)

四、向量数据库

关于知识向量库内容,看ZOMI酱up主该套视频足矣:向量数据库介绍,Vector和Embedding关系 #大模型 #向量数据库_哔哩哔哩_bilibili


(其它再说,最近太忙了,没时间写,挖个坑、下次一定!)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值