科技发展带来的最大冲击就是人工智能(AI)不断替代人力工作,而现在,连AI自身的“教育者” - 数据标注行业也面临被这个“学生”逐渐取代的挑战。这个现象在数据标注领域引发了一个迫切的问题:我们是否迎来了“AI训练AI”的时代?
AI取代人工标注?智能数据标注由重人力向重技术转变
传统的大模型训练依赖于由人类标注员标记出的大量高质数据,这也就是我们常说的基于人类反馈的强化学习 (RLHF)。然而,随着新的训练方法的出现,人工并不再是唯一选择。在一篇最新的论文中,谷歌研究团队提出了名为RLAIF的训练方法,通过AI自身进行数据标注,得出的训练结果甚至可以与RLHF相媲美。这不得不引发我们深思,未来数据标注员将何去何从?
AI取代人工标注?智能数据标注由重人力向重技术转变
不过,这一技术转变并非易行。目前,自动化标注方法还无法满足所有任务标注需求,它更多的是作为人工标注的辅助工具出现。简单的标注问题可以交给AI完成,而人工依然在处理涉及复杂逻辑和具有争议的场景的标注任务中发挥主导作用。然而,这也预示着未来的数据标注行业的门槛将会进一步提高,需求将从重人力转化为重技术。
AI取代人工标注?智能数据标注由重人力向重技术转变
但未来是什么样的,我们并不清楚。有人认为,人工标注对于泛化仍然至关重要,或许在某些情况下,RLHF与RLAIF的混合方法更具优势。然而,无论结果如何,数据标注服务公司们均已做好准备,准备迎接这个变革,或是向做自动化标注工具的方向发展。
AI取代人工标注?智能数据标注由重人力向重技术转变
这个进程并非只有挑战,也充满了机遇。如果正确把握,这也许是数据标注行业,甚至整个AI技术研发领域的又一次突破。现在的问题是,我们能否妥善应对这次转变,打开新的可能性?(一览AI原创)