2024面经
腾讯自然语言处理研究实习一面围绕项目1讲。IE抽取用了什么模型?怎么建模问题的?围绕项目2讲。怎么对llama做中文扩展的?有没有预训练(我没有参与预训练)。IFT数据是怎么生成的(我讲了self-instruction,其它其实都是没什么可讲的苦力活)项目1和项目2涉及的相关八股会问一下。Bert和GPT的区别?LLama和传统Transformers的区别?(我说了pos embed和activation,所以还有什么区别?)Transformer为什么要处以根号d_k?有什么





