测试Bard和ChatGPT对双休有关法规的认知和简单推理

stereohomology

已于 2023-11-22 08:27:56 修改

阅读量441

点赞数

文章标签： bard chatgpt 自然语言处理人工智能

于 2023-11-17 13:55:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/stereohomology/article/details/134461117

版权

Bard是试验品，chatgpt是3.5版的。

首先带着问题，借助网络搜索，从政府官方网站等权威网站进行确认，已知正确答案的情况下，再来印证两个大语言模型的优劣。

想要了解的问题是，在中国，跟法定工作时间有关的两个法律法规，一个是1995年开始实施、最新2018年修订的《劳动法》，一个是1995年修订国务院第146号令的国务院第174号令，是否冲突，以及哪个优先。

下面是Bard的回答，简直毫无逻辑和底线，不但弄错国务院令的内容、还杜撰出已经废止的答案，如果是真人的话，绝对是无赖级别的、道德有问题：
在这里插入图片描述 ChatGPT3.5虽然在逻辑上也存在类似问题，但可接受程度要高很多，也不至于把人误导到坑里还死不认账。

但是，他们在特定概念（比如法令、法律）的唯一确定性（或同一身份）认知上，存在天然的缺陷，这个问题我以前查特定论文、并要求给出论文的doi代码也发现过：chatgpt 3.5给出的doi跟论文完全没有关系，而且它会根据谈话背景杜撰出标题是你想要找的可能根本不存在的所谓论文来误导；在进行简单的逻辑推理方面，可以说是毫无逻辑可言（完全无法依赖其逻辑推理能力）。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。