对话 IJCAI2024 大会主席张成奇:克服了幻觉,大模型就不够「靓丽」

397356f34e17ce12c00adb9662d46574.jpeg

“导游、养老等错误敏感度低的领域很适合推广大模型。”

来源:AI科技评论

作者:王悦 张进

编辑:陈彩娴

第 33 届 IJCAI 大会在韩国济州岛圆满结束,为期一周(8.3-8.9)的 IJCAI 吸引了来自全世界各地人工智能领域的研究者和关注者,大会现场的氛围跟 8 月的济州岛天气一样火热,现场的热情氛围昭显了当下人工智能领域的蓬勃发展。

延续了 IJCAI 2023,此次大会最热门的两个领域依然是计算机视觉跟机器学习,有关大模型的话题往往参与者众。此次参会人数将近 3000人,论文提交数量超过 2023 年的 23.8%。

张成奇是 IJCAI 首位华人大会主席,也是进入 IJCAI 理事会的第三位华人,前两位分别是IJCAI 2019理事会主席杨强和IJCAI 2023理事会主席周志华。

张成奇告诉 AI 科技评论,他跟 IJCAI 的渊源要追溯到2011 年,这一年在他的积极参与下澳大利亚墨尔本成功取得了 IJCAI 2017 的举办权。这一届赞助创历史新高,赞助费超 70 万美元,这是与张成奇的努力密不可分的。

更重要的是,张成奇本人在人工智能领域的成就亦不容小觑。

张成奇于 1982 年在吉林大学攻读硕士研究生,从事专家系统方面的研究,而吉林大学是中国最早开始研究人工智能的单位之一。早年,张成奇曾用9年时间做一项研究,最终于1992年在 “国际人工智能杂志(Artificial Intelligence Journal)”上发表了大陆华人中的第一篇AI 期刊文章。根据2024年8月份Google Scholar统计,张成奇的所有文章被引用总数超过33000次,H-Index为70。

f4a7cbcd9c63f1847ecb818726601dc3.jpeg

在从事人工智能和数据挖掘领域研究的 40 多年时间里,张成奇取得了丰硕的研究成果,到目前为止,共发表 300多 篇科技论文,很多论文都发表在顶级期刊。曾于2011年获得新南威尔士州科学与工程(工程和ICT类)奖,并在2011年获得悉尼科技大学副校长卓越研究(领导类)奖。

大会主席张成奇认为,IJCAI 的举办极大地促进了当地人工智能领域的交流,此次 IJCAI 选址韩国相比在其他地方举办韩国参会者多出超 20 倍。

在韩国济州岛举办的 2024 IJCAI 现场,AI 科技评论跟张成奇对话,讲述他首次担任大会主席的感受、本次 IJCAI 的变化以及他对当下人工智能发展、大模型发展的一些看法。以下是对话原文(经过简单编辑):

1

IJCAI 更严格了,

但被接收的大部分都是好文章

AI 科技评论:今年各国的参会人数在整体参会者中占比大约是多少?

张成奇:中国参会者大概可以达到参会总人数的 1/3 左右。韩国参会者人数相比在其他地方举办多了起码 20 倍,占总参会人数的1/5左右。IJCAI 选址对当地参会人数会有很大地促进作用,比如 2017 年澳大利亚的 IJCAI ,有 500 多澳大利亚人参加(大约1/4),这次澳洲过来的学者就只有 70 人左右。

AI 科技评论:我们观察到,今年 IJCAI 的很多赞助商都来自中国。

张成奇:是的。从 2017 年起主要的赞助商都来自国内,这次来的参展企业有信也科技,百度、滴滴、华为、美图、OPPO、ViVo、京东,贝式计算等。

IJCAI 从 2017 年开始,专门设置了一个 Sponsorship Officer,之前是我在负责,从去年开始由于涵负责,我来协助。

企业赞助的钱每年都可以资助很多学生,金额可以达到数十万美金,受资助的学生也更愿意在这个会议上投论文,这是一个正循环。

AI 科技评论:组织 IJCAI 的过程中,是否遇到过很大的困难?

张成奇: IJCAI 整体进程推进得较顺利。由于我自己有组织过很多场大型国际会议的经验,对其中的节奏把握有很多经验,可以算得上驾轻就熟。在近30年来,我先后在澳大利亚人工智能年会、亚太人工智能年会、亚太数据挖掘大会、国际数据挖掘大会这些会议中多次担任大会主席。

AI 科技评论:您担任过这么多地区会议、国际会议的华人主席,有什么感受?

张成奇:能够担任顶会主席的人非常少,其中的华人就更少。我之前当过 KDD、ICDM 的主席,这次也担任了 IJCAI 的主席。这一系列主席当下来之后,至少感觉组织事情更有条理了。

a5b43eebe2804d2b04b1fca88a043d87.jpeg

张成奇与学者在 IJCAI 现场交流

另一个角度来看, IJCAI 是综合性会议,强调涵盖更多、更丰富的 AI 垂直领域,不像 CVPR、ICML 这些只关心一个研究领域的垂直会议。

综合性会议的特点是,文章接收量的范围相对宽一些,但想要办出大名气就比较难。

2

应用大模型要注意

“领域的错误敏感度”

AI 科技评论:您怎么看待今天的大模型?

张成奇:大模型叫生成式模型,生成式模型最大的优点是它生成效果很靓丽,“脑子”很发散,像人一样很聪明。但是最大缺点是有幻觉,而且幻觉无法被克服,如果克服了幻觉,那么生成式模型也就没有那么靓丽了。

人的聪明之处在于解决问题,人算 38的平方是算不过计算机的,计算机在这种传统、有标准的东西范围是不会出错的,大模型反而会出错。这就是大模型的优缺点。

AI 科技论:我们应该如何利用现在的大模型?

张成奇:要注意区分大模型在不同领域的错误敏感度。

举三个例子:

第一个场景,核电站维修完全不能容忍错误,任何概率包括 0.01% 的错误都不能容忍,这种情况的错误敏感度较低;

第二个场景,写诗作画可以随意发挥,写错、做错没有坏的影响,这种情况的错误敏感度就较高;

第三个场景,股票交易可以出错,因为股票没有 100% 赚钱的,只要赚钱超过50% 就可以,这种情况的错误敏感度就是中性。

因此,大模型很发散、很聪明,但是它不保证全部对,也不保证没幻觉。所以这时使用者要考虑不同领域的错误敏感度,中性敏感度只要它正确率超过 50%,是可以被使用的。很多人吐槽幻觉问题,说有幻觉就不能用了。但其实并不是这样,写诗作画、股票交易等领域都是可以用的。

99.9% 的人都是大模型的使用者,很难决定或左右大模型是否拥有幻觉。但我们可以判断各种领域对错误容忍的敏感度,什么领域能用,什么领域不能用。不仅要考虑模型能力好不好,还要考虑是否和对应的领域适配。

但需要知道的是,大模型的幻觉问题不能从根上解决,否则的话它就不是大模型了,也不是生成式了。所以不能只盯着难以被解决的幻觉问题,要扬长避短、趋利避害。

AI 科技评论:在您的判断中,目前阶段有哪些适合大范围应用大模型的领域?

张成奇:导游行业。比如规划一条路线,多绕几分钟没有太大关系,只要别发生危险就可以,所以这个领域容忍度很高。从这个角度开发垂直大模型是值得尝试的。

智能养老也很适合做大模型应用,中国的养老,有两个刚需,分别是健康和饮食。于健康管理而言,需要精准控制吃药的时间、药量、频率等;于饮食管理而言,比如糖尿病的人哪些食品不能吃?身体寒寒的人哪些食物不能吃?食谱怎么给千人千面的搭配?这些是大模型能够帮助实现智能化和个性化的方面。

除此之外,情感陪伴,也可以使用现在的生成式模型来实现,无论是外在的形象、实体陪伴,还是语言、情感的陪伴都也可做得很丝滑。

社交层面,也可以通过大模型匹配到不同的兴趣爱好圈,加入不同的话题。还有运动管理,比如一位70岁老人是走 5,000 步还是走1万步呢?是早晨走,中午走还是晚上走?是分开走,还是和别人一起走?都可以从大模型上去寻找答案。

开发通用大模型无需过度考虑领域问题,但要是做垂直领域大模型,一定要选好领域。

AI 科技评论:大模型发展的下一步趋势是什么?

张成奇:一方面是减少算力,提高效率;另一方面是应用领域会越来越宽。沿着这两个方向改进,都是渐进性的进步,至于之后能不能有 break through,就需要看底层架构有没有突破,需要有像 GPT 这样革命性的变革。

因此,在通用领域上,大模型比 99% 的人都聪明,但是在专业领域中,他们始终无法超越专家。

大模型的技术专家都在研究怎么解决幻觉、怎么提高效率。但还有一个层面,也需要站在普通老百姓用模型的角度看,怎样去把现有的大模型能力更好地发挥出来,怎样能够让技术更普惠人类社会。我认为更多要从上往下走,从现象中将本质抽象出来后,再往下落。

AI 科技评论:具身智能也在今年掀起了一波热度,你认为这是泡沫吗?

张成奇:人的智能大致可以分成感知、认知、行为三个方面。深度学习解决了感知问题,GPT + 深度学习在很大程度上解决了认知问题,而行为智能方面一直没有很大突破,所有机器人控制都是属于行为智能。

现在要做的事,是把感知、认知、行为等多种智能的层面融合起来。早期人工智能为什么没法用?就是因为它感知上不过关,认知层面在前进,但是还没有到达终点,后边有好多东西要做,但也能实现很多工作了。

所以为什么家庭机器人还要需要时间?就是因为他的行为执行还是有难度。现在有了GPT,它的能力会上一个大台阶,这些台阶已经够消化 5 年 10 年了。

AI 科技评论:具身智能下一阶段将如何发展?

张成奇:具身智能这个方向一定能得到长足的发展,原因是现在的智能,不管感知、认知,单独拿出来都是没法用。

AI 科技评论:如何看待 Agent?

张成奇:Agent 原来就是一个方向,很多年了一直火不起来,后来热度到低谷,现在又升上去了。原因是之前对环境的感知判断做得不好,现在环境感知已经提高了很多,剩下需要做好协调工作。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

c86b9255144d51e682dcafe12788ec16.jpeg

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值