- 博客(1)
- 收藏
- 关注
原创 Datawhale-llm-universe 第一章 LLM介绍打卡
1.1 LLM的定义和概念大型语言模型(LLM)是人工智能模型,旨在理解和生成人类语言。LLM通常包含数百亿参数,通过在海量文本数据上训练,获取对语言的深层次理解。常见LLM有GPT-3.5、GPT-4、PaLM、Claude、LLaMA、文心一言、讯飞星火、通义千问和ChatGLM等。LLM展现出"涌现能力",即随着模型规模的扩大,处理复杂任务的能力显著提升。1.2 发展历程20世纪90年代:研究集中在统计学习方法预测词汇。2003年:Bengio首次将深度学习应用于语言模型,提升了模型性能。
2024-06-20 00:08:40 747 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人