小马智行楼天成关于AI的观点大幅刷新我的认知

        最近看了小马智行楼天成的访谈文章,非常推荐大家去看。其中他提到的几个核心观点,是大幅刷新我的AI认知的,分享给大家。

        楼的核心观点是

        1)当前通过收集优质数据,数据驱动AI训练产出的端到端模型,只能做出L2.99999的智能驾驶。

        这种方式只是拟合现有数据,并没有给出某些智能逻辑,所以模型的能力会被数据的表现所限制。

        L2作为辅助驾驶,驾驶表现只要表现得跟人一样就行,所以用大量的数据训练,能够灌出L2级别的智能驾驶,但天花板也相对很明显。L4自动驾驶系统的表现,要好于正常人类认知的10倍,因此,大量平庸的数据其实没有益处。

        2)L2和L4走的是两条相反的路,L2做的越好可能L4做的越差,L4做的越好可能L2做的越差。

        你跟一个臭篓棋子学下棋,那你就是他的水平,不会更高了。如果类似臭篓棋子的数据越多,数据就会变成负担,垃圾数据越多,干扰越大。

        更深一层来讲,这些数据已经教不了模型了。就像教小孩儿乒乓球,你水平都不如他那不是瞎教吗?所以要找教练。现在的做法是,训练一个很好的模型来训练端到端。而能训端到端模型的模型,本身就是一个很难的东西。

        所以L4的路径是,训练一个世界模型,世界模型就像是一个教练,教端到端模型如何去自动驾驶。

 

        从前我的认知,一直是优质数据训练AI模型,但是从楼的观点延展开来,我想到了alphaGo和alphaZero,alphaGo就是数据训练模型的典型代表,而alphaZero则是0数据起步,通过规则的摸索和试错得到的模型,在这个例子里,alphaGo是L2,alphaZero是L4,L2是模仿,而L4是掌握。从这个角度来说,alphaZero相比alphaGo是革命式的飞跃。

        而L4和L2也存在路径上的本质不同。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值