基于大模型实现因果推断的探讨

最新推荐文章于 2024-07-15 15:20:24 发布

罗伯特之技术屋

最新推荐文章于 2024-07-15 15:20:24 发布

阅读量51

点赞数

分类专栏：信息技术控制系统和理论专栏文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_57147647/article/details/139596785

版权

信息技术控制系统和理论专栏专栏收录该内容

70 篇文章 1 订阅 ¥69.90 ¥99.00

订阅专栏

超级会员免费看

摘要

大模型是利用海量数据形成庞大参数量的机器学习模型，而因果推断是推断和理解事件、变量或行为之间的因果关系。从大模型与因果推断相互结合的可能性和难点、大模型预训练、因果模型的人类反馈学习过程和微调技术等方面进行探讨，论述了大模型具有发现潜在因果关系的机制和因果关系预测及解释的潜力。此外，归纳了部分大模型开源工具，可用于快速实现大模型训练、验证和部署。

0 1

概述

1.1 大模型

大模型指利用海量数据用自监督方法进行训练而生成拥有庞大参数量的机器学习模型，它们为下游任务提供了优良的分布式特征表示能力和模型泛化能力。例如，处理复杂问答的多轮对话能力、人类情感对齐能力、数学问题的求解能力等。从大模型的发展上看，在2022年11月底，OpenAI发布了ChatGPT［1］，2023年3月14 日，GPT-4 也随之发布。这2个模型的问世让全球切身感受到了人工智能从数据中形成智能的潜力。与此同时，随着MetaAI开源了备受瞩目的LLaMA［2］框架以及斯坦福大学提出了Stanford Alpaca［3］模型，业界开始涌现出更多类型的大模型。在国内，百度、腾讯、华为、阿里等互联网头部企业竞相布局AI产业，并推出“文心一言”“混元AI大模型”“盘古Chat” “通义千问”等一系列通用化大模型。可见，我国AI大模型发展加速，行业的垂直应用也呈现出多样性、加速性和广泛性。

1.2 因果推断

因果推断［4-9］是一种统计和推理方法，旨在理解和推断事件、变量或行为之间的因果关系。因果推断可以被总结为3个层次。从问题角度出发，因果推断的第1个层次是相关性，即

了解本专栏

超级会员免费看

罗伯特之技术屋

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
基于大模型实现因果推断的探讨

摘要大模型是利用海量数据形成庞大参数量的机器学习模型，而因果推断是推断和理解事件、变量或行为之间的因果关系。从大模型与因果推断相互结合的可能性和难点、大模型预训练、因果模型的人类反馈学习过程和微调技术等方面进行探讨，论述了大模型具有发现潜在因果关系的机制和因果关系预测及解释的潜力。此外，归纳了部分大模型开源工具，可用于快速实现大模型训练、验证和部署。 0 1 概述1.1 大模型大模型指利用海量数据用自监督方法进行训练而生成拥有庞大参数量的机器学习模型，它们为下游任务提供了优良的分布式特征表
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

罗伯特之技术屋 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。