超越图灵测试:判断机器是否在思考的现代方法

本文探讨了图灵测试作为判断机器是否具备思考能力的局限性,提出了更新的标准,包括设置一系列旨在测试智力各个方面的固定问题,以及采用评分系统来评估计算机与人的回答差异。作者强调,真正的挑战在于创造能够展示深度理解和目标导向行为的问题,而非仅仅模仿人类对话。
摘要由CSDN通过智能技术生成


全文共2189字,预计学习时长6分钟

图源:slate

 

人工智能正在改变生活的方方面面,大多数专家认为,今天的人工智能进化为人工通用智能只是时间问题,计算机迟早会达到甚至超过人类智能的临界点。但问题是,我们如何知道这种情况何时会发生?

 

1950年,艾伦·图灵提出了著名的测试方法,用来判断机器是否真的在思考。这一测试在论文发表后经历了一些演变,其中一个常见的解释是这样的:

 

一个人,即审讯者(C),可以通过电脑终端进行交流(现在,我们可能会说通过即时通讯、电子邮件或短信);在计算机链路的另一端是人(B)或计算机(A)。经过20分钟的键盘通信后,询问者会表明在另一端是人还是计算机。

 

如果审讯者认为他在和一个人交谈,但实际上是一台电脑,那么结论就是,这台电脑一定在像人一样思考。为了让计算机“通过”测试,这个实验要进行多次,超过一半的审问者同意。

 

最近,对图灵测试的一种改进将对话时间缩短到5分钟,并认为如果计算机愚弄受试者的时间超过30%,测试就通过了。2014年,一个名为Cleverbot 的程序被声称通过了图灵测试,愚弄了33%的审讯者。然而,虽然Cleverbot有一些复杂的反应,但我与它的互动很快暴露了其局限性。

 

                            

不过,我宁愿对图灵的测试吹毛求疵,也不愿对Cleverbot s的主张吹毛求疵。我有两个主要担忧:

 

·        图灵测试的名声推动了诸如Cleverbot或Watson等程序的发展,这些程序拥有惊人的语言能力,但却牺牲了针对真正AGI的资源。

 

·        为了通过测试,计算机必须被设定为会说谎。有没有私人问题,比如你多大了?眼睛是什么颜色的?甚至你是一台电脑吗?如果电脑如实回答,那就是泄密。在某种程度上,

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值