自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 详细说说:长文本和Sparse Attention的结合有哪些?

长文本和Sparse Attention的结合有哪些,详细说说

2024-09-25 19:40:44 986

原创 211硕士遭怒怼:稀疏注意力机制都不会?

211硕士遭怒怼:稀疏注意力机制都不会?

2024-09-24 19:40:55 535

原创 复旦女硕复试,被LongLoRA微调问懵了…

上周面的复旦女硕,问了LongLoRA微调

2024-09-24 19:36:02 1045

原创 985硕士,最近投了100多份大模型算法岗,没下文...

从面试官的视角看,什么样的简历算一份优质的简历?以及如何快速把简历改好。

2024-09-12 18:51:48 1271

原创 因为不懂推测解码,被面试官鄙视了...

推测解码—无障碍实现10倍大模型的推理

2024-09-10 19:54:38 1186

原创 研究生秘籍 | 不为导师当苦力,抓住实习机遇

读研的同学请记住一句话啊,一边偷懒一边学习。

2024-09-04 19:38:54 516

原创 为什么Transformer推理要做KV缓存?

从面试官的视角,来拆解这个Transformer的面试连环炮

2024-09-03 20:02:36 1926

原创 上周面的一个985女生,问了Transformer模型的内存优化

面试加分项:掌握Transformer模型的内存优化方法

2024-08-21 19:40:33 609

原创 阿里面试惊现难题:大模型服务吞吐率太小咋整?

大模型服务的吞吐率太小怎么解决?

2024-08-15 19:44:10 1282

原创 字节面试官:什么是RRF,你能解释一下吗?

今天我们来聊聊 RRF(Reciprocal Rank Fusion),如果你简历上写了 RAG 的内容,一定要清楚以下 RRF 相关的问题。

2024-08-14 20:31:14 3363

原创 阿里一面:Transformer从头问到脚。。。

阿里一面深度解析:Transformer模型的全面探索

2024-08-13 19:59:35 814

原创 华为985硕士裸辞:八个月过去了,还没有找到工作...

大模型中的分组查询注意力机制(GQA),如果面试时你被问到这个知识点,应该如何应对?

2024-08-12 20:44:33 978

原创 算法秋招的同学,推荐两个准备面试的神器!

强烈推荐大家这两个面试准备神器,秋招加油~

2024-08-09 19:37:35 421

原创 阿里面试官:大模型上线前为什么要做推理优化?985学妹的满分回答!

大模型上线前为什么要做推理优化,这么回答面试满分!

2024-08-08 19:31:30 500

原创 大模型算法,入职两个月,不想干了...

很多同学觉得,我学了这么多机器学习深度学习算法,还学了大模型训练、微调、推理优化,最后入职的工作就是写写提示词,调调开源模型,干一些边角料的杂活儿,特别没有成就感

2024-08-07 21:49:13 1461 1

原创 写给大模型新人的经验,刷到少走三年弯路!

新人如何无痛转行大模型赛道?

2024-08-07 21:47:49 875

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除