深度学习中的token

token包含:class token、patch token,在NLP叫每一个单词为token,然后有一个标注句子语义的标注是CLS,在CV中就是把图像切割成不重叠的patch序列(其实就是token)。


Tokenization is a way of separating a piece pf text into smaller units called tokens.And tokens are the building blocks of Natural Language,which can be either words, characters, or subwords.
举个例子,“Never give up”,Tokenization 成words tokens:Never-give-up。
再举个例子,“smarter”,characters tokens:s-m-a-r-t-e-r ;subword tokens:smart-er。
 


在大型语言模型中,"token"是指文本中的一个最小单位。通常,一个token可以是一个单词、一个标点符号、一个数字、一个符号等。在自然语言处理中,tokenization是将一个句子或文本分成tokens的过程。

在大型语言模型的训练和应用中,模型接收一串tokens作为输入,并尝试预测下一个最可能的token。对于很多模型来说,tokens还可以通过embedding操作转换为向量表示,以便在神经网络中进行处理。由于大型语言模型处理的文本非常大,因此对于处理速度和内存占用等方面的考虑,通常会使用特定的tokenization方法,例如基于字节对编码(byte-pair encoding,BPE)或者WordPiece等算法。

世界被字节化以后,再次会被 token化


在NLP比如BERT,输入一段句子,分词器会将句子中的单词、符号转换成一个个token。对于视觉Transformer,把每个像素看作是一个token的话并不现实,因为一张224x224的图片铺平后就有4万多个token,计算量太大了,BERT都限制了token最长只能512。所以ViT把一张图切分成一个个16x16的patch(具体数值可以自己修改)每个patch看作是一个token,这样一共就只有(224/16)*(224/16)=196个token了。当然了,单单的切分还不够,还要做一个线性映射+位置编码等等。不同的Transformer在处理细节上也会有不同,比如最近看的Swin-T加入了多尺度,从最开始的4*4的patch缩放到后边的32*32


  • 4
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的课程设计、期末大作业和毕设项目,作为参考资料学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研,自行调试。 基于Django,keras,axios, echats的智能股票分析系统源码+文档(集成LSTM的实践序列预测算法).zip ## 项目说明 **项目目标与功能** > 分析股价综合分析预测工具的功能需求,研究其设计及实现技术。设计股价综合分析预测工具的总体结构,实现如下功能: > > - **展示大盘指数行情、股票对比分析、个股信息分析** > - **明日股价预测、股价区间预测、股价走势预测、股价涨跌预测** > - **登入、注册,登出** > - 对所实现的部分进行测试和评价。· **项目技术栈** > - 生态:Python 3.8 > > - Web框架:Django 3 > > - 数据存储技术:Dataframe文件存储 > > - 深度学习框架:keras > > - 前端技术:bootstrap4+jquery+ajax+echats > > - 算法:lstm,归一化 **项目结构** ![img](image/clip_image001.png) **结构说明** > - stock:Django项目的主app > > - stockapp:实现股票展示、预测、更行等操作的app > > - forecast:算法模块,存放预测算法、数据处理函数、各种工具类函数。 > > - static:存放系统各种静态资源(js,css) > - templates:存放前端html页面 > - stockList.html:主页,展示所有股票的列表 > - stockDetail.html:股票详情页,展示股票的详细信息 > - stockSinglePredict.html:股票预测页,展示针对单个股票的预测结果(包含股票走势、区间、变化、明日股价1) > - stockComparison.html:股票对比页面,对比两只股票的信息 > - marketIndex.html:展示大盘指数 > - data:ts_code.csv(代码为ts_code的股票的数据存放文件),allStock.csv(存放所有股票的简要信息) > - backup:保存临时的代码文件,无用,可以直接删除 **重点说明stockapp下的各种文件作用** > ![img](image/clip_image002.png) > > .pytest_cache:系统缓存文件 > > migrations/:此目录包含Django应用程序的数据库迁移文件。每当您更改数据库表时,都应该创建一个新的迁移文件,并运行migrate命令来将更改应用于数据库。 > > app.py:此文件定义了Django应用程序的配置。您可以在这里指定应用程序的名称,URL配置和其他设置。 > > url.py:此文件包含Django应用程序的URL配置。您可以在这里定义哪些URL应该与哪些视图函数匹配,并将它们映射到适当的视图函数。 > > views.py:此文件包含Django应用程序的视图函数。视图函数处理来自URL的请求,并根据需要从数据库检索数据,并将其呈现为HTML响应。 > > calculate_indicators.py:计算股票的各种指标 Stock**下各种文件的作用**: > ![img](image/clip_image003.png) > > - settings.py:此文件包含Django项目的所有设置。您可以在这里指定数据库配置,静态文件路径,安装的应用程序列表等等。 > - forms.py:此文件包含Django应用程序的表单类。表单类用于验证用户提交的数据,并将其转换为模型实例。 > > - manage.py:此文件是Django项目的命令行工具。您可以使用它来运行服务器,创建数据库迁移,运行测试等等。 ## 项目部署与运行 **准备工作** 项目用到了tushare 的api,需要使用者自行去tushare官网申请账号,获取api token填写到如下的位置: <img src="image/image-20230716000221588.png" alt="image-20230716000221588" style="zoom: 67%;" /> tushare官网:[Tushare数据](https://www.tushare.pro/) 获取api token的url:[Tushare数据](

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值