自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 GPU的并行计算

分批在不同卡中计算数据,然后汇总到一张卡中更新参数最后发到各个模型中进行同步更新,类似map reduce,由于每一张卡都存了一份模型数据造成了数据冗余。batch size不能太小不然模型会出现梯度随机的情况。将模型拆开,类似于指令流水线,会造成GPU空间浪费。batch size太大会造成显卡资源不够的情况。张量并行,可以在一张GPU中进行。模型并行和数据并行可以同时进行。单机多卡--同步数据并行。激活函数可以用于列并行。

2024-11-06 11:10:37 87

原创 transformer与bert简介

为了增强模型的表达能力,Transformer 使用多头注意力机制,即通过多个并行的自注意力模块来捕捉输入的不同部分之间的关系,每个模块有自己独立的 Query、Key 和 Value。transformer中的核心机制,允许模型在处理每个单词的时候,权衡句子中所有其他单词的相关性,与RNN不同,它能并行计算并处理序列中的所有单词。与传统的单向语言模型(如 GPT,只能从左到右生成文本)不同,BERT 能够在一个词的表示中结合它左右两边的上下文,因此可以更好地捕捉语义。

2024-11-05 14:28:37 307

原创 float16 和 float32在模型加载和推理过程中应该如何选择

float16 和 float32在模型加载和推理过程中应该如何选择

2024-11-04 16:53:54 263

原创 python 列表相关知识点

元组:与列表类似,是由一系列按规定顺序进行排序的元素组成,用()创建或者tuple创建,与list区别,list是可修改的序列,而元组是不可以修改的,即创建无法修改当前元组。a.index(x,start,stop)计算元素x在列表a下标start到stop中第一次出现的位置。a.count(x)计算x在a中出现的次数,如果未出现则为0,否则为出现的次数。可以获取删除的内容 ,没有参数默认删除末尾的参数。a*x:a是list,x是int,构成一个新列表,其内容为a复制x次。删除列表中值为的参数。

2024-09-11 16:14:58 252

原创 语言模型概述

2024-07-24 12:45:26 216

原创 nlp的任务分类

序列标注:分词/POS Tag/NER/语义标注。句子关系判断:文本匹配/Entaiment/QA。分类任务:文本分类、情感分析。NLU:理解自然语言。NLG:生成自然语言。

2024-07-24 12:19:14 263

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除