- 博客(2)
- 收藏
- 关注
原创 2024各大厂AI大模型招聘面试题总结合集
大模型LLM(Large Language Models)通常采用基于Transformer的架构。Transformer模型由多个编码器或解码器层组成,每个层包含多头自注意力机制和前馈神经网络。这些层可以并行处理输入序列中的所有位置,捕获长距离依赖关系。大模型通常具有数十亿甚至数千亿个参数,可以处理大量的文本数据,并在各种NLP任务中表现出色。
2024-10-03 10:30:00 1583
原创 如何从0开始搭建一个大语言模型并进一步训练微调?
生成式AI技术已成为产业升级的新晋引擎,加速推动数字经济高速发展,开发者则需要快速掌握生成式 AI 技能,并熟练掌握领先的工具平台,在竞争激烈的技术变革时代脱颖而出,实现“技术躺赢”。知识增强类大语言模型作为生成式 AI 技术的代表,也是最早进入我们工作和生活的落地场景,随着国内外各个大语言基础模型的快速更新迭代,我们生活中都或多或少在接触着大语言模型,如你手机的语音助手,或者国内热门生成式AI工具,都是企业基于大语言模型的尝试,那么问题来了,如何从0开始搭建一个你自己的大语言模型呢?
2024-10-02 10:30:00 878
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人