以前省吃俭用学编程,现在得卖房了......

一个初创公司的CEO,想从Meta挖一个资深的研究人员,帮助开发一个AI问答引擎。

b66c9a563264d3eb078425c14f8434bd.png

没想到人家根本不领情:“等你有了1万块H100,再来找我吧!

看了这个消息,我心里真是五味杂陈,时代变了,大模型的研发,变成了巨头的狂欢。

一块英伟达H100,保守点儿按3万美元算,1万块就是3亿美元,20多亿人民币!

自己买不起显卡,没法从头儿训练,用开源的总可以吧!

马斯克开源的Grok,就是已经训练好的3140亿参数的大模型,想跑起来需要628G显存的GPU

acc5d2fc2678329f6c9608300fc372cd.png

一块H100显卡有80G显存,也就是需要8块,折合168万人民币,相当于中小城市的一个房子了。

Grok太大了,用个小点儿的吧。

同样开源的Llama 2 70B有700亿参数,对GPU的要求稍低,但也得140G的显存。

360c39e7ec22e39bbaf21efeea89f9d1.png

消费级显卡4090有24G显存,需要6块。

我看了下京东,每块的价格大概是1.8万,全部下来得10万了

ba91ddc1c83d09404b2fac239b643351.png

这样的价位一般的开发者谁能付得起呢?

上面说的还只考虑参数因素,只是把模型跑起来做推理,如果做训练,那要求的显存就更吓人了

记得之前学习编程,所需要的就是一台普通电脑,省吃俭用一下还是可以买的,然后把Java、Python、MySQL、Nginx、Tomcat、Redis之类软件下载下来,安装上就好。

移动开发最多再加一台安卓手机,iOS生态贵一些,但也没有到夸张的地步。 

想开发个网站?写个App?没人能阻挡你,能阻挡你的只是精力、时间和创意。

从来没有听说过“CPU太贵了,买不起,没法学编程”之类的说法。

现在学会了神经网络,深度学习,反向传播等基础知识,又读了不少大模型的文章,磨拳擦掌想小试牛刀,赫然发现,兜里没钱买4090!

即使弄个7B、13B的小模型,然后咬咬牙,放点儿血,买个高性能的云服务器把算力搞定了,还得去折腾训练数据,然后不断训练的开销又是一个让人肉疼的数字。

于是,很多人就是尝尝鲜,玩一把就算了,赶紧把吞金兽云服务器给释放了。

大模型距离个体程序员真是越来越远了。

真可谓省吃俭用学编程,卖房投身大模型啊。5485b9a59a0b7f683d4980a981495c2e.png

为什么会这样呢?

要怪只能怪AI走上了“力大飞砖”的路子。

一个神经网络,动辄几百亿,几千亿的参数,需要大量的数据来训练、调整这些参数,需要难以想象的算力。

af3ffe6f3fbe252d4cf8b6946aa80973.png

巨头们耗费巨资在炼丹,其他人参与不进去,只能在一边嗑瓜子旁观,再加上一堆起哄的,忽悠不明真相群众买Prompt课程。

这可能是AI叫好不叫座,迟迟不能落地的一个重要原因。

创新需要大家都能够自由地,随机地、多方向去尝试,这样才可能找到一些好点子,好的商业模式,才能像移动互联网时代众多的App一样来改变日常生活。

而现在的大模型由于其超高的门槛,把绝大多数人都拦在了门外。

不过也不用沮丧,如果一个技术真的能让大众得到好处,它必然也会在程序员身边普及,前几年热门的高并发就是一个很好的例子。

高并发基本上那些大厂和热门应用的专利,因为只有这些地方才有海量的用户和真正的分布式系统,而普通程序员根本没机会接触,就像昂贵的大模型一样,没法去实践。

但是在各种场合的面试中,高并发又都是一个必问的知识点,这该怎么办呢?

很简单,先去学习高并发相关的知识,自己先在本机写点儿简单的并发程序员,然后想办法在云端搭建分布式系统,模拟高并发系统,做点儿“低并发”的编程,获取实战的经验。

有了实践经验打底,找工作面试时就会言之有物,面试官也会理解,毕竟不是每个人都有机会跟着一个系统从单体到分布式的。面试官看到你的潜力,就有可能获得机会。

有些人直接进了大厂,有些人进不了,也能进“中厂”,“中厂”的系统可能流量没那么大,但毕竟是真正的分布式系统,这样经验进一步积累,为将来进入大厂,做真正的高并发做好了准备。

很多人都是这么过来的,我想大模型也是这样的,如果它真的能深入生活的各个方面,这门技术的普及和渗透也会走类似的道路。

不管它现在的门槛有多高,程序员要做的,就是保持一个好奇心,接近它,了解它,学习一些理论知识,努力想办法动手折腾一下,大模型太贵搞不了,就搞“小模型”,“小模型”也搞不定,就折腾“小小模型”......总之,为将来的机会做好准备。

全文完,觉得不错的话点个或者在看吧。

3447393e700c523bc18bdc213e55b0f0.png

我的新书《码农翻身2》近期正式出版,这本书开启了5折优惠,全彩印刷,用故事给技术加点料,原价118元,现在仅需59元,第一批仅有5000册,赶紧抄底!

《码农翻身2》特点就是把看似枯燥乏味的技术,变成好玩有趣的故事。绝对值得购买纸质版收藏。

著名的张大胖又会遇到各种各样的挑战,不得不“重新发明”各种知名软件和技术。

编程语言王国之间依然争斗得你死我活,今天Java向Python渗透,明天JavaScript就向Java猛烈进攻。

而C语言春节回家,发现只有自己没有对象,十分悲催。

MySQL和Redis互相看不顺眼,不断向对方使绊子。

......

此外,这本书和《码农翻身》一样,每篇文章都是独立的,你不用从头到尾去看,完全可以放在桌边/床边,随时挑选一篇小故事去阅读,看完一篇就可以放下,以后再看。所谓“开卷有益”,希望你随手翻翻就能够掌握一点技术知识,体会技术所带来的乐趣。

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值