- 博客(3)
- 收藏
- 关注
原创 大模型算法面试题(三)
BERT的核心原理在于通过在大规模文本数据上进行预训练,来捕捉语言的深层双向表征。这种预训练使得BERT能够在各种NLP任务上通过微调(fine-tuning)快速适应并取得优异性能。遮蔽语言模型(Masked Language Model, MLM):类似于完形填空任务,模型被训练来预测输入句子中被随机遮蔽的词。这一任务有助于模型学习语言中的词汇和语法结构。下一句预测(Next Sentence Prediction, NSP):模型需要判断两个句子是否是连续的文本序列。
2024-07-16 20:59:53
616
原创 大模型算法面试题(二)
LangChain是一个基于大语言模型(LLM)的框架,由Harrison Chase创建于2022年10月。它并不直接开发LLM,而是为各种LLM实现通用的接口,将相关的组件“链”在一起,从而简化LLM应用的开发过程。LangChain支持多种组件功能,如模型集成、提示工程、索引、记忆、链、代理等,为开发者提供了灵活且强大的工具来构建复杂的LLM应用。LangChain的核心架构是其链式架构,允许开发者将不同的组件(如模型、提示、索引、记忆等)组合成一个处理流程。
2024-07-15 21:38:16
574
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人