👨💻作者简介: CSDN、阿里云人工智能领域博客专家,新星计划计算机视觉导师,百度飞桨PPDE,专注大数据与AI知识分享。✨公众号:GoAI的学习小屋 ,免费分享书籍、简历、导图等,更有交流群分享宝藏资料,关注公众号回复“加群”或➡️点击链接 加群。
🎉AI学习星球推荐: GoAI的学习社区 知识星球是一个致力于提供《机器学习 | 深度学习 | CV | NLP | 大模型 | 多模态 | AIGC 》各个最新AI方向综述、论文等成体系的学习资料,配有全面而有深度的专栏内容,包括不限于 前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关(简历撰写技巧、面经资料与心得)多方面综合学习平台,强烈推荐AI小白及AI爱好者学习,性价比非常高!加入星球➡️点击链接
💚AI面经专栏总结: 本专栏主要为总结各小中大厂的面经系列总结,内容涵盖了多个热门技术领域,包括但不限于算法、机器学习、CV、NLP、大模型、测开、大数据、数分等,内容包括问题及详细答案,此外金邀请了行业内经验丰富的技术专家和面试官,分享面试经验和技巧,帮助求职者顺利通关各类技术面试。
算法工程师面经系列
元象科技 大模型推理优化工程师
-
项目介绍
-
实习项目的模型的改进方法
-
欠拟合的原因和解决方法
-
为什么transfomer的效果会更好?它是怎么对图像的边缘特征进行表征的?然后为什么它是Q K V三个向量而不是四个五个呢?
(1) 因为它引入了自注意力机制和位置编码,这些机制使其具有出色的全局建模能力和并行计算能力。
(2) 在自注意力机制和位置编码中对图像边缘特征进行表征,和其余的特征的处理过程没有什么不同。
(3) 因为Q、K和V是自注意力机制的关键组成部分,它们具有以下作用:
Q(查询): 用于确定模型应该关注的位置或特征。
K(键): 用于计算查询与不同位置或特征之间的相似度得分。
V(数值): 包含了真正的特征向量,用于计算最终的加权和。
这三个向量的组合允许模型在不同位置之间建立关系并对特征进行加权。在不同应用中,可以调整它们的维度以适应不同的数据和任务。增加更多向量可能会引入不必要的复杂性,而减少向量可能会限制模型的能力,因此通常使用Q、K和V三个向量是一种权衡。 -
怎么100万个数据中查找自己想要找的数
(1) 哈希查找,时间复杂度O(1)
(2) 排序+二分查找,建立二叉搜索树(AVL树、红黑树、b树)等,时间复杂度O(logn)
(3) 遍历,O(n) -
怎么把两个无须的1TB的文件排序好放在一个文件里面
归并排序,分布式处理 -
移动通信中把信息从A传输到B,一般是用TCP还是UDP?
分情况,如果是不注重可靠、更注重速度、实时性,可以用UDP,如果注重准确性、完整度,可以用TCP。大多数情况下都是用TCP。