摘 要
大模型是利用海量数据形成庞大参数量的机器学习模型,而因果推断是推断和理解事件、变量或行为之间的因果关系。从大模型与因果推断相互结合的可能性和难点、大模型预训练、因果模型的人类反馈学习过程和微调技术等方面进行探讨,论述了大模型具有发现潜在因果关系的机制和因果关系预测及解释的潜力。此外,归纳了部分大模型开源工具,可用于快速实现大模型训练、验证和部署。
0 1
概 述
1.1 大模型
大模型指利用海量数据用自监督方法进行训练而生成拥有庞大参数量的机器学习模型,它们为下游任务提供了优良的分布式特征表示能力和模型泛化能力。例如,处理复杂问答的多轮对话能力、人类情感对齐能力、数学问题的求解能力等。从大模型的发展上看,在2022年11月底,OpenAI发布了ChatGPT[1],2023年3月14 日,GPT-4 也随之发布。这2个模型的问世让全球切身感受到了人工智能从数据中形成智能的潜力。与此同时,随着MetaAI开源了备受瞩目的LLaMA[2]框架以及斯坦福大学提出了Stanford Alpaca[3]模型,业界开始涌现出更多类型的大模型。在国内,百度、腾讯、华为、阿里等互联网头部企业竞相布局AI产业,并推出“文心一言”“混元AI大模型”“盘古Chat” “通义千问”等一系列通用化大模型。可见,我国AI大模型发展加速,行业的垂直应用也呈现出多样性、加速性和广泛性。
1.2 因果推断
因果推断[4-9]是一种统计和推理方法,旨在理解和推断事件、变量或行为之间的因果关系。因果推断可以被总结为3个层次。从问题角度出发,因果推断的第1个层次是相关性,即