深度学习_GPT2Block详解(casual attention)

一、GTP2Block 整体结构

1.1 block准备

import torch 
from torch import nn
from transformers import GPT2Model, GPT2Config
from transformers.models.gpt2.modeling_gpt2 import GPT2Block

cfg = GPT2Config()
print(cfg.add_cross_attention)
blk = GPT2Block(cfg, layer_idx=0)
hidden_states = torch.randn(10, 1024, 768)

1.2 block架构

经典的preNorm TFDecoder架构

GPT2Block(
  (ln_1): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
  (attn): GPT2Attention(
    (c_attn): Conv1D()
    (c_proj): Conv1D()
    (attn_dropout): Dropout(p=0.1, inplace=False)
    (resid_dropout): Dropout(p=0.1, inplace=False)
  )
  (ln_2): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
  (mlp): GPT2MLP(
    (c_fc): Conv1D()
    (c_proj): Conv1D()
    (act): NewGELUActivation()
    (dropout): Dropout(p=0.1, inplace=False)
  )
)

1.3 forward-preNorm

y = attn(ln_1(x)) + x
O = mlp(ln_2(y)) + y

在这里插入图片描述
在这里插入图片描述

二、GPT2Attention

  1. hidden 拆分成 q k v: query, key, value = gpt2_att.c_attn(hidden_states).split(split_size, dim=2)
  2. q k v 拆分成多头
query = gpt2_att._split_heads(query, gpt2_att.num_heads, gpt2_att.head_dim)
key = gpt2_att._split_heads(key, gpt2_att.num_heads, gpt2_att.head_dim)
value = gpt2_att._split_heads(value, gpt2_att.num_heads, gpt2_att.head_dim)
print(f'{
     query.shape=}') # [batch, n_head, len, head_emb] 
  1. 计算attention
    1. A ^
瑞萨e2studio是一款专为瑞萨微控制器设计的集成开发环境(IDE)。它支持多种外设驱动程序的生成,其中包括三相PWM(Pulse Width Modulation)驱动。`r_gpt_three_phase`是用于配置和控制三相PWM的一个模块。 以下是关于如何在e2studio中配置“Three Phase PWM Driver on r_gpt_three_phase”的详细介绍: ### 配置步骤 #### 1. 创建项目并添加外围设备 - 打开e2studio,并创建一个新的硬件工程。 - 在“Peripheral Wizard”界面选择需要使用的MCU型号(如RX系列或其他适合三相电机控制的芯片),然后勾选“General Purpose Timer Pulse Unit (R_GPT)”选项。 #### 2. 初始化 `r_gpt_three_phase` - 进入“Configure Pin Assignments”,设置与三相逆变电路相关的GPIO引脚功能分配,例如A/B/C三个通道对应的PWM输出端口。 - 转到“Timer Settings for R_GPT Three-phase Output Mode”。在此页面上调整定时器周期、占空比以及死区时间等关键参数值,以满足目标应用需求。 * **频率**:确定所需的PWM信号频率; * **占空比**:设定每个阶段的具体工作比例,默认情况下可以先保持50%作为初始参考点; * **Dead Time Insertion(DTI)** :插入适当的死区时间为防止上下桥臂同时导通造成直流通路问题; #### 3. 编程实现动态调节 完成以上基础配置之后,在主函数内通过调用API接口对上述各项属性进一步实时修改,比如改变速度时就需要不断更新相应PWM波形数据。 ```c++ /* Example Code */ // Include necessary headers and initialize peripherals as described earlier. void adjustSpeed(float dutyCyclePercentage) { if(dutyCyclePercentage >= 0 && dutyCyclePercentage <= 100){ // Convert percentage to actual count based on timer resolution. uint16_t newDutyCount = (dutyCyclePercentage / 100) * max_count; // Call API function provided by e&sup2; studio BSP or HAL driver library. RGPT_SetCompareMatchValue(channel_A, newDutyCount); RGPT_SetCompareMatchValue(channel_B, another_newDutyCount); RGPT_SetCompareMatchValue(channel_C, yet_another_newDutyCount); } } ``` ### 注意事项 - 确保所有连接线缆牢固可靠避免松动引起意外故障。 - 根据实际负载情况合理规划散热措施以防过热损坏器件。 - 测试过程中密切观察电流电压变化趋势及时发现潜在隐患。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Scc_hy

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值