字节跳动P0级事故:实习生删除GB以下所有模型,直接上了今日头条......

 
 

往期热门文章:

 
 
 
 
 
 
 
 
 
 
 
 
1、1 个月崩 3 次!盘点一下 2021 年的 10 个宕机名场面
2、这类视频遭破解,大量上传B站,行为恶劣!
3、滴滴程序员被亲戚鄙视:年薪八十万还不如二本教书的...
4、IT界惊现文豪!华为领导及阿里P10遭吐槽
5、上海地铁乘车码“变红”,吓倒一众乘客,官方:为营造节日气氛……

来源:codingsky.com/news/2021-06-24/114315.html

曾经我招过一个实习生,他曾经干过一件让我感到匪夷所思的事:

我当时忙,让他把服务器重启,他直接来了个电源重启。

最近脉脉上有网友爆料,字节跳动一位实习生删除了公司所有轻量级别的机器学习模型

1de8ecc0fd7985af624228b51ab369fa.png

图片
e7447726cf942ea1ea178a34ebc753a5.png
图片

什么是lite模型?

该楼主表示,lite模型就是公司内几乎所有GB大小以下的机器学习模型,且全部被删除了,实习生直接删除的是父目录且加了 skip trash (删除文件时临时禁用回收)操作,导致被删除模型无法被恢复。

c378d18fe168ef8255147e128d5f0301.png

图片

当晚全公司通报,直接被列入 P0 事故等级(严重事故):

01f966a25102e15cd734fd5c7e562df3.png

图片

据楼层讨论,光是处理问题的群就进了接近三百人,其殃及业务之广可想而知:

6de41077033fe7a7977bb46496afe73b.png

图片

大家都在讨论这位实习生的去留,我们搜了一下,据说,“只要不是主观故意的”就不会被开除:

ce5ae6bb2b6fa37a9d3ae8cd736c65ab.png

图片

所以说一定要稳住别慌,问题不大。

0f010d708c78895ae877154075c6f921.png

网友热议

有网友表示这是实习生给你们这帮人出了一道hard题,不过没有标准答案,考验你们解题能力的时候到了。

f89cec9035b0448622456fdf72f1ffcf.png

图片

还有网友表示实习生不能有权限操作这么重要的东西,这锅80%应该判给管理者,实习生反倒是暴露了问题,换个角度来看,实习生立功了。

afd1294d2c3ce0a5128d92a1ea0dbfd9.png

图片

我们知道,字节跳动最出名的文化之一,就是扁平化管理。实习生与正式员工有同样的文档权限,这也是字节能够在与BAT等大厂竞争中保持灵活高效的秘诀,从这个角度上来说,说实习生立功倒也不能算错。

f36aaf0d82190f6ad382cfce53871d4d.png

图片

而别的对手就权限不一了。

60ed90401c2b84acaf1dc42cc22be508.png

图片
ebd8cac3db32f6a942dabb986adefa93.png
图片

到底删除了多少模型?

根据字节网友后来发到网上的疑似截图显示,被删除的只是:“Lagrange Lite 全量 Batch模型的备份”,且显示为「被误删」。

481277038e99a469bca60739ff784fb9.png

图片

又有字节的工程师网友表示删除的都是离线数据,影响不大。

该楼主好像对此事非常热衷,全程在线跟帖,表示“确实影响不大但是麻烦,重新训练模型和延迟上线理论上都会对指标有负向只是不那么明显了”。

5b2de2be827ed90374f62e176200ba60.png

图片

实习生“立大功”

650160d89cdb4b396c9eb3ff2e2150d6.png

2018年据英国《金融时报》报道,谷歌内部一位实习生无意中犯下一个“小”错误,导致一则没有意义的广告投放到“大量”网页和应用中,持续了大约为45分钟,相关费用和清理成本达到1000万美元,真可谓小手一抖,千万元没有。

字节 AI

字节都有什么出名的机器学习产品?

字节跳动最早是以今日头条来闯荡江湖,在今日头条以及后来的抖音和火山等产品上肯定用到了不少机器学习推荐算法,这就先不提了。

此外,在抖音这款“有毒”的产品上,也时不时见到各种运用 AI 算法来做人脸变化的技术应用,比如最近的在抖音上比较火的重返3岁的AI特效等等。

8e3955d17d52e022527bc487327c2f8f.png

图片

据 AI科技评论 所知,字节还开源过一个名为LightSeq的序列推理引擎,它对以 Transformer 为基础的序列特征提取器(Encoder)和自回归的序列解码器(Decoder)做了深度优化,早在 2019 年 12 月就已经开源,应用在了包括火山翻译等众多业务和场景。

据了解,这应该是业界第一款完整支持 Transformer、GPT 等多种模型高速推理的开源引擎。

de8b90445bbe2ed15f0d4943303a82b4.png

图片

LightSeq 可以应用于机器翻译、自动问答、智能写作、对话回复生成等众多文本生成场景,大大提高线上模型推理速度,改善用户的使用体验。

相比于目前其他开源序列推理引擎,LightSeq具有如下几点优势:1. 高性能;2. 支持模型功能多;3. 简单易用,无缝衔接Tensorflow、PyTorch等深度学习框架。

据 AI科技评论 所知,字节跳动AI Lab最近计划要开源「新版训练加速引擎」,可以让模型训练加速3倍以上。

最后,据这次的误删除事件来看,1GB 的模型其实不算大,大概只有几亿的参数量级,反观现在 AI 江湖动则千亿万亿起步的模型,1GB以下的模型真的不算大,算不上是决定性的模型。

或许此次事件对字节只是一件不痛不痒的小事,字节的高层或许压根不知道此事,毕竟这又不是删库跑路。

339f0282d6cc18cd6b528050058ef3b4.png

图片

虽说如此,但程序里的bug是个玄学,有时哪怕某个小bug产生的影响往往也是难以预料的,有时会牵一发而动全身,若是赶巧也可能影响整个产品线。

往期热门文章:

1、历史文章分类导读列表!精选优秀博文都在这里了!》

2、再见 BeanUtils!对比 12 种 Bean 自动映射工具,就它性能最拉跨!

3、暴力拒绝白嫖,著名开源项目作者删库跑路,数千个应用程序无限输出乱码

4、两天两夜,1M图片优化到100kb!

5、12 个顶级 Bug 跟踪工具

6、这些 SQL语句真是让我干瞪眼!

7、1个人6种变现途径收入130万美金在2020年

8、“阿里味” PUA 编程语言火上GitHub热榜,标星2.7K!

9、Chrome 再次引入争议 API,遭同行抵制!

10、IDEA高效使用教程,一劳永逸!

2de635ca22324d9f13c211d36867c097.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值