基于大模型实现因果推断的探讨

摘  要

大模型是利用海量数据形成庞大参数量的机器学习模型,而因果推断是推断和理解事件、变量或行为之间的因果关系。从大模型与因果推断相互结合的可能性和难点、大模型预训练、因果模型的人类反馈学习过程和微调技术等方面进行探讨,论述了大模型具有发现潜在因果关系的机制和因果关系预测及解释的潜力。此外,归纳了部分大模型开源工具,可用于快速实现大模型训练、验证和部署。

   0 1   

 概  述

1.1 大模型

大模型指利用海量数据用自监督方法进行训练而生成拥有庞大参数量的机器学习模型,它们为下游任务提供了优良的分布式特征表示能力和模型泛化能力。例如,处理复杂问答的多轮对话能力、人类情感对齐能力、数学问题的求解能力等。从大模型的发展上看,在2022年11月底,OpenAI发布了ChatGPT[1],2023年3月14 日,GPT-4 也随之发布。这2个模型的问世让全球切身感受到了人工智能从数据中形成智能的潜力。与此同时,随着MetaAI开源了备受瞩目的LLaMA[2]框架以及斯坦福大学提出了Stanford Alpaca[3]模型,业界开始涌现出更多类型的大模型。在国内,百度、腾讯、华为、阿里等互联网头部企业竞相布局AI产业,并推出“文心一言”“混元AI大模型”“盘古Chat” “通义千问”等一系列通用化大模型。可见,我国AI大模型发展加速,行业的垂直应用也呈现出多样性、加速性和广泛性。 

1.2 因果推断

因果推断[4-9]是一种统计和推理方法,旨在理解和推断事件、变量或行为之间的因果关系。因果推断可以被总结为3个层次。从问题角度出发,因果推断的第1个层次是相关性,即

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

罗伯特之技术屋

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值