在人工智能技术的浪潮中,大模型以其强大的数据处理和学习能力,成为推动科技进步的重要力量。然而,这种跨领域应用的过程并非一帆风顺,既面临挑战也蕴含机遇。本文从复旦大学的研究工作出发,详细分析大模型的机遇与挑战。
背景
GPT4技术报告指出,GPT4仍处于通用人工智能(AGI)的初级阶段。而GPT4.5或GPT5已展现出AGI的某些特征。GPT4的出现给研究和工业界带来了巨大冲击,其显著特点是拥有强大的底座知识能力,超越了传统知识图谱。
大模型的推理成本
大模型的推理成本限制了其应用。构建和使用大模型都需要大量资源,且在实际应用中大模型的推理速度相对较慢。随着大模型上下文长度的增加,处理整个文档库将需要巨大的计算资源,导致推理成本进一步上升。
大模型在复杂决策场景的缺陷
尽管大模型在聊天机器人等开放式闲聊场景中表现出色,但在工业、商业等严肃场景中,如替代程序员编写代码,大模型目前仍显不足。从开放式闲聊到复杂决策,大模型还有很长的路要走。
大模型的领域适配
当前,领域大模型如医疗大模型、金融大模型等备受关注。持续预训练是构建这些模型的基本方法,但数据问题至关重要。在选择训练数据时,面临数据质量和数据配比的挑战。
大模型的能力提升
我们强调大模型协同能力的重要性,而不仅仅是模型在考试题中的表现。首要工作是提升大模型理解复杂指令的能力。这些指令可包括各种特定要求,如格式约束、内容约束等。
大模型的协同工作
大模型虽功能强大但成本高昂,并非所有流程都需其参与。从数据层面和应用特点出发,可以将任务分类。大模型与小模型应协同工作,根据任务需求去适配并执行一个流程。
大模型的可靠性问题
在专业领域,我们强调只有可溯源的结果才能赢得用户的信任。大模型在回答问题时能够引用原文,确保答案的可靠性和准确性。
话题标签
#人工智能 #大模型 #科技进步