Beyond One-Model-Fits-All: A Survey of Domain Specialization for Large Language Models

大模型系列文章,针对《Beyond One-Model-Fits-All: A Survey of Domain Specialization for Large Language Models》的翻译。

摘要

大型语言模型(LLM)极大地推动了自然语言处理(NLP)领域的发展,为广泛的应用提供了非常有用的、与任务无关的基础。LLM作为一般任务解决者的巨大前景促使人们将其功能远远扩展到“聊天机器人”之外,并将其用作医疗保健、金融和教育等特定领域的领域专家和工具的助手,甚至替代者。然而,直接应用LLM来解决特定领域中的复杂问题会遇到许多障碍,这些障碍是由领域数据的异质性、领域知识的复杂性、领域目标的独特性和约束的多样性(例如,领域应用中的各种社会规范、文化一致性、宗教信仰和道德标准)造成的。为了填补这一空白,近年来对LLM的领域专业化进行了爆炸性的研究和实践,然而,这需要进行全面和系统的审查,以更好地总结和指导这一有前景的领域。在这篇综述论文中,首先,我们提出了一个系统的分类法,根据LLM的可访问性对LLM领域专业化技术进行分类,并总结了所有子类别的框架以及它们之间的关系和差异。我们还对可以从专门的LLM中受益的关键应用程序领域进行了全面的分类,讨论了它们的实际意义和公开挑战。此外,我们还对该领域的当前研究现状和未来趋势提供了见解。

1 引言

自然语言处理(NLP)和人工智能(AI)模型的演变经历了一个显著的轨迹,从20世纪50年代和60年代的基于规则的系统开始,到20世纪90年代过渡到统计模型,再到2010年代神经网络的出现。由于自注意和基于Transformer的神经网络架构的

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值