面试
文章平均质量分 90
进阶媛小吴
规则简单易懂,粗暴却完美!
https://github.com/wuliwuxin
展开
-
Transformer构架的优劣及常见问题
例如,FasterTransformer在4.0版本时引入了并行解码过程,通过张量并行以及流水并行的方式,即将计算拆分到多张GPU卡上进行,使得多张GPU协同工作,从而大幅提升了推理速度。在时间序列分析领域,Transformer模型也取得了显著的进展。在自注意力机制中,每个词都会与序列中的所有其他词进行比较,计算出一个注意力权重,这些权重决定了每个词对其他词的重要性。此外,Transformer还可以通过张量模型并行的方式,将网络层的输入、参数与运算分到不同的卡上,进一步提高计算效率。原创 2024-07-09 08:22:58 · 2192 阅读 · 0 评论 -
C语言题目1
计算一个字符串在另一个字符串出现的次数//计算一个字符串在另一个字符串出现的次数#include <stdio.h>#include <string.h>int main(){ int i,j,k,count; char s1[20],s2[20]; printf("输入主串s1:\n"); gets(s1); printf("输入主串s2:\n"); gets(s2); count = 0; for(i=0;i<strlen(s1);i++){ f原创 2020-05-14 17:35:30 · 299 阅读 · 0 评论 -
面试题:以下函数的结果什么?-阿里巴巴
面试题-阿里以下函数的结果什么?#include <stdio.h>void foo(int *a,int*b){ *a = *a + *b;//① *b = *a - *b//② *a = *a - *b;//③} int main(){ int a = 1,b = 2,c = 3; foo(&a,&b); foo(&b,&c); foo(&c,&a); printf("%d,%d,%d\n",a,b,c);//④ r原创 2020-05-14 17:23:50 · 565 阅读 · 0 评论