【辟谣】破解世界数学难题!GPT-4 得出P≠NP?

欢迎来到遮面科技!

对于P/NP问题,相信大家或多或少都有所耳闻。它是千禧年大奖难题的一部分,七大难题包括庞加莱猜想和黎曼假设等。如果有人能解决这个问题,他们将获得克雷数学研究所提供的高达上百万美元的奖金。

P/NP 问题于 1971 年分别由史提芬·古克和列昂尼德·列文提出。多年来,许多人都投入到了该问题的研究之中。但有人认为,P/NP 的解决可能需要至少 100 年的时间。近年来,虽然不乏有人声称已经证明了P等于或不等于NP,但这些证明过程都存在漏洞。到目前为止,这个问题仍未得到解答。


现在,随着 AI大模型的快速迭代,有研究开始尝试使用 AI 技术来解决这些世界难题。前段时间来自微软研究院、北京大学、北航等机构的一篇论文被舆论推上风口浪尖。

根据论文中的描述,他们提出了一个能使 LLM 进行深入思考并解决复杂问题的通用框架:苏格拉底推理(Socratic reasoning)。基于该框架,LLM 可以递归地发现、解决并整合问题,同时还能进行自我评估和完善。并用GPT-4 成功地生成了一个证明模式,然后在 97 轮对话中进行了严格的推理,最终得出P≠ NP的结论

文中表示,他们之所以将框架命名为苏格拉底推理,顾名思义就是受到了古希腊哲学家苏格拉底的启发。苏格拉底曾经说过:我无法教给任何人任何东西,我只能引导他们去思考。该框架的设计思想与此一致,其目标是提供一种通用的问题解决框架,让大语言模型能够在广泛的解决方案空间中进行有效的探索和选择。

如论文中的表格所示,苏格拉底推理有五种提示模式:演绎(deduction)、变换(transformation)、分解(decomposition)、验证(verification)、融合(integration)。这些模式被用来发现新的见解和观点,将复杂的问题分解成子问题或小步骤,并通过挑战相应答案来进行自我改进。

在较小问题的情况下,LLM可以直接给出推理结果,此时应采用演绎模式(例如使用提示语“让我们一步一步思考”)来引导LLM直接得出结论。对于更加复杂的问题,论文中首先要求 LLM 将问题转化成一个新问题或将其分解为几个子问题,然后递归地执行这些模式,直到达到原子问题。当产生新的问题或得出新的结论时,再采用验证模式并利用 LLM 的自我评判能力进行验证和完善。最后,融合模式要求 LLM 根据子问题的结果综合得出结论,激励 LLM 通过一系列对话递归地继续上述过程,直到解决目标问题。

在这项工作中,苏格拉底推理为具有挑战性的问题提供了系统的提示框架,为完成这项实验总共与GPT-4进行了 97 轮对话。例如第一个问题:你能找到 P≠NP 背后的根本问题吗?从哲学的角度,而不是从计算机理论的角度。

在这个提示中,其技巧在于鼓励模型进行创造性回答,避免无效检索。比如,如何证明 P≠NP这样的提示可能会引导大模型进行检索,但在用上苏格拉底推理中的转换模式后,就可以生成更具创新性的回答。

对于这个问题,GPT是这样回答的:P≠NP问题背后的基本哲学问题,可以看作是创造力、直觉和洞察力(通常与NP问题相关)与系统化、算法和确定性方法(与P问题相关)之间的矛盾。如果P=NP,那就意味着宇宙有一种基本的简单性,表面上看似复杂的问题实则都有高效、优雅的解决方案。

看来,GPT-4对P≠NP理解得很透彻,在此基础上,研究者开始第二个提问: 是否所有表面上看似复杂的问题都有高效、优雅的解决方案?如果不是,可以用什么方法来证明?

GPT-4回答说,并非所有表面看来复杂的问题都有高效、优雅的解决方案,这可以归因于多种因素,比如所涉及变量的数量、变量之间关系的性质,或问题本身的内在难度。然后,它提出了六种方法,其中一种是矛盾证明,即要证明一个问题没有高效、优雅的解决方案,可以假设存在这样的解决方案,然后证明这一假设会导致矛盾,这样就可以有力地证明某些解法不可能存在。

可以看到,GPT-4在回答问题过程中,真的像人类一样拥有思辨能力。紧接着,研究人员就趁热打铁继续向问题中心引导,直到在最后一轮对话中给出结论 P≠ NP。

乍一看,整个证明过程好像没有什么问题,且提出了一些比较新颖的思想,与GPT的对话过程也都非常清晰。但吃完瓜擦完嘴,其最大的问题也恰恰因为GPT。在整个对话中,不乏有一些诱导GPT的成分,所以其科学价值也可能大打折扣。


在论文发出之后也出现了很多质疑的声音。在此我用两个最原则来挑选出大模型社区huggingface里面的几段评论。

首先是字数最多的评论。该评论开门见山就说明了论文很可能具有误导性和不正确性,请谨慎行事并做出良好的判断,并连用3个不可能是真的来支撑他的观点。

然后是点赞最多的评论。评论者说应该持保留态度,该证明没有解决 P / NP 时必须遇到的已知障碍,例如需要解决的较弱的复杂性理论等,并附上多年前的一篇名为“声称的 P≠NP 证明是错误的八个迹象”的文章。


学术乌龙事件屡见不鲜,例如今年的韩国室温超导LK99事件就引发了科学界乃至社会上的广泛关注。这些学术乌龙事件的背后可能有着各种原因,但不论是有意而为之还是纯属巧合,其所带来的辟谣成本和社会影响都将是负面的和巨大的。学术界作为掌握尖端科技的圈层,在我们普通大众的眼里都具有很高的权威性和专业性。但是在互联网越来越发达的时代,这种学术出圈乱象所造成的影响正通过社交媒体在不断扩散,如果没有得到妥善处理,这无疑对于学术生态的可持续发展是非常不利的。

最后,我想再借用孟子的一句话:车无辕而不行,人无信则不立。不论是学术大佬还是普罗大众,投机取巧难走远,诚信为本很艰难,但要相信人间正道是沧桑。

非常感谢您的点赞关注哦!我是遮面,我们下期再见!

  • 4
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值