Qwen1.5-1.8B
计算参数量=1.8B
1、Embeddings 参数计算:
vocab_size
: 151936hidden_size
: 2048- 参数量 =
vocab_size
×hidden_size
(embedding matrix) = 151936 × 2048 = 311164928 - embedding matrix:
embedding层的逻辑
- 输入词汇索引:模型接收到一个输入序列,例如一句话,每个词被映射
1、Embeddings 参数计算:
vocab_size
: 151936hidden_size
: 2048vocab_size
× hidden_size
(embedding matrix) = 151936 × 2048 = 311164928embedding层的逻辑
- 输入词汇索引:模型接收到一个输入序列,例如一句话,每个词被映射