2020年数据标注行业回顾及2021年展望

2020年虽说是艰难的一年,对于我个人来说是很有收获的一年,所以本篇文章也是想和小伙伴们一起分享回顾一下2020年,再一同展望一下2021年行业的发展,给更多的小伙伴提供更多的参考机会。所以本文从三个方面和大家交流一下。

  • 个人的回顾

  • 2020年数据标注行业回顾总结

  • 2021年数据行业的展望与机遇

 

一.个人的回顾

之所以要把个人的角度也放到一块内容来聊,有两个想法,第一在做公众号的将近一年的过程中,了解到很多小伙伴的有一些迷茫,希望我的一些总结可以给小伙伴一点参考和启发。第二是系统的总结回顾一下一年的事情。

  1. 公众号

    从2020年2月9日发布第一篇文章到目前发布了34篇原创文章,是我个人对行业的理解也是一种记录,很高兴作为一个90后能在我最好的年纪可以见证一个行业的从0起步发展壮大的过程并有机会参与其中,能让我真真切切的感觉到这个时代的发展变化的脉搏,这也是非常大的一种乐趣。更要感谢每一位关注我的小伙伴,可以有机会跟大家一起深入的交流,碰撞出想法和火花。

  2. 教育

    1. 结识了几位非常好的老师,一起出了一本《数据标注实用教程》的教材,为行业系统性发展做一些贡献,同时计划基于基础数据处理部分也要继续出几本系统的教材。

    2. 基于数据标注开发出了一套课程体系和实训平台,在学校、基地、企业落地使用。

    3. 数字产业学院的推进,前期准备工作基本完成,2021年有序推进。

    4. 搭建了数据标注的认证培训体系。

  3. 基地

    参与推进3个城市数据基地的落地工作,虽然疫情造成了一些影响,但是工作还是要有序进行。由于正在推进暂时还不方便透露。基地的作用主要是做基础数据人才的培养和数据相关业务的落地。

  4. 产业园

    参与在沈阳推进落一个供应链金融的数字产业园,数字经济实际是落地应该是基于数据的应用,也就是我们经常提到了数字产业化,产业数字化,脱离行业的技术最终也会是空中楼阁。所以数字经济最核心还是基于产业数据创造价值。也要结合实际行业需求来做数字创新。

 

在这个给做数据标注行业并且想深入发展的小伙伴一个小小的建议,数据标注是一个数据应用的处理环节,不实际产生核心价值,不管是个人从业者、还是创业来做这个方向的小伙伴,应该更多的考虑数据应用的上下链接或者拓展的协同发展。当然有在做以上几个方向的小伙伴,欢迎随时交流沟通。

 

二.2020年数据标注行业回顾总结

2020年发生了黑天鹅事件,对数据标注行业在上半年有很大的冲击,数据标注行业作为新生的数据服务行业核心业务还是依赖与算法公司的订单,所以在人工智能公司产品市场化不成熟、融资不顺的情况下,生意不好也是合理的。但是2020年对于人工智能基础数据服务的发展还是非常至关重要的一年。我们就分一下几个维度来回顾一下。

图片

图片

 

  1. 政策维度

    • 职业认定

    • 专业设立

  2. 行业数据维度

    注:原始数据来源于网络抓取,如有遗漏纯属正常

  • 2020年4月份-12月份数据标注业务相关公司数量对比

图片

图片

        这两张图其实想表明两个问题和大家交流:

  • 2020年4月份到12月份的相关数据标注需求公司增量为24.78%。

  • 最近看到多家公司在宣传上表明自己的客户几千家,其实一直对于这类数据持有怀疑态度,所以挂上上面两张图只是友情提示一下,不管是基于哪种维度来统计的客户数量,故事要能讲的圆满。

  • 2020年4月份TOP15和12月份TOP15地区排名

2020年4月份:

图片

2020年12月份:

图片

注:很多渠道说这两年成都的发展势头特别猛,一看数据是真信了。

  • 2020年4月份TOP15和12月份地图分布

2020年4月份

图片

2020年12月份:

图片

  • 分公司或基地主要分布

    注:存在两家及两家分公司以上公司,排除母公司所在地外后成立分公司或基地地区的分布

图片

图片

        目前来看全国至少38个城市分别在开设相关数据处理的项目或基地,可以给小伙伴们做一个很好的参考。

  • 建设分公司或者基地的公司分布情况

    注:存在两家及两家分公司以上公司,排除母公司所在地外后成立分公司或基地地区的分布

图片

    从数据来看很多头部公司在各个地区也存在分公司或基地,那么未来可能就会存在存量市场中的订单释放分配问题。

 

三.2021年数据行业的展望与机遇

 

上面跟小伙伴们聊了一下2020年发生的节点事件以及一些基础数据。下面部分和大家聊聊2021年的一些展望和一些大胆设想。

 

但对于平台类公司的发展机遇个人认为也会在2021年展现出来,平台类核心应该是在数字处理的基础设施,在数据处理的效率和多场景化数据或解决方案的敏捷输出上。虽然在存量市场上由于成本等各个因素的影响下发展受限,但在增量市场的技术能力迁移应用上,是必然需要的。

 

先说一个问题,最近也有好多新入行的小伙伴留言,说新加入这个行业想多交流一下,个人建议如果没有从事过这个行业仅仅就是听说门槛比较低的创业项目的小伙伴谨慎入行,原因如下:

 

存量市场期大部分需求来源于人工智能算法公司研发阶段,这个阶段的需求特点是人工智能算法需求相对盲目、对整体模型训练所需数据预估存在较大偏差,所以需求量也相对较大,但是进入到产品场景化落地阶段模型对数据量的需求预估相对较准确、需求的针对性也更强,所以项目更多是短快的小项目。而这个研发过程是不可逆的,所以单个类型数据标注需求量成规律性变化就很好理解了。

 

在增量市场中客户的主力军更侧重于AI的真实应用客户,这边客户研发周期和成本更为看重、也更看重的是效果,更需求的是成体系的解决方案以及可敏捷开发的平台工具,所以个人认为在存量市场竞争激烈,增量市场中更重要的能力应该是敏捷、解决方案的反向输出。这样行业壁垒也会逐步建立,经过将近5年的发展,个人为2021年会是一个转折。

 

  1. 基地建设机遇、问题及建议的讨论

    1. 机遇

      去年中下旬开始陆续开始的数据标注基地建设逐步开始,但由于疫情原因整体的速度没有设想的速度发展,疫情逐渐平稳、又是十四五的开年搭着数字经济、人工智能、工业物联网等国家战略的加持2021年会有一个更好的释放,期待行业的蓬勃发展。

    2. 问题

      但对于基地发展来讲各个认为有两方面的问题比较突出。

      1. 行业订单释放的问题,从目前的数据来看各个数据处理需求的头部公司如阿里、字节跳动、科大讯飞、快手等都有分公司或基地。那么未来数据处理的需求的存量市场竞争会更为激烈,增量市场尽快打开的需求也迫在眉睫。

      2. 基地问题

        基地存在最大的问题的基地运营的问题,目前在行业中大部分平台类型的公司很多都是后起之秀,在基地实际运营上经验缺乏。很多三线及三线以下城市的产业链并不完整在以服务外包形式落地的项目缺乏产业链支撑,未来存在风险,所以在很多项目落地的时候应该更全面。

    3. 建议

      1. 基地发展模式是一种必然,这个是市场和政府发展的需求,也是抢占新数字经济生产力上游服务市场的好机会。但建议还是公司、政府要各司其职。

      2. 数据标注是一个数据处理的环节,不具有产生核心价值的能力,如果单独发展数据标注行业,其结果就是服务外包。建议结合当地的资源优势或地区发展战略优势快速建立具有产业场景化的数据处理、应用等上下游产业链。

         

  2. 平台类公司发展的困境与机遇

    个人认为今年平台类的标注公司的发展难度会增加,但在这种情况下更容易出现行业内的龙头企业,个人认为核心有三点:

    1. 平台类公司的竞争壁垒优势没有完全显现,对于存量市场来讲工具类型的平台公司的工具使用成本比较高。

    2. 由于基地的建设不少头部企业会把存量市场的业务分发到基地,各地方基地的建设也加快了实际数据供应商企业的正规发展,并且在合理情况的成本降低。

    3. 平台公司良性运营亟待提高,例如问题比较大的一个方面便是结算问题,大部分平台类公司的结算周期在合同上都会签拿到供应商发票后的30个工作日到45个工作日,而其实平台公司基本不会垫付项目款,也就是在客户给平台公司结算还会有一个周期时间,而如果客户支付项目款的周期为30个工作日,那么基本上供应商拿到项目款的周期就可能在30个工作日到75个工作日,很可能是一个季度,这样对于供应商来讲的项目资金成本就已经吃掉了利润的一部分,所以在这个逻辑下平台类的运营就无法形成良性。

    4. 之前也写过一篇文章讨论了一下关于很多公司发展方向的问题,产学院、再就业、扶贫、基础设施建设等方向,个人最不看好的就是拿扶贫作为宣传点的公司,数据标注的确是一个相对简单的数据岗位,但是其实也是一个技术岗,具有技术岗的基本素质要求和发展模式。

  3. 产学研发展讨论

    从成本的角度来看很早就有公司盯上了几个可以快速降低用工成本方式的方向,如扶贫、再就业、产学研等,本身这个行业进行产学研的发展模式也是一种必然,是产业发展与教育脱节的优化解决方式,但是个人非常反对粗暴式实训就业方式,以降低企业用工成本为出发点的产学研结合,这是一种非常不负责的。

    虽然职业化教育更多的是让孩子们可以学到实际工作的技能,在未来可以有一技之长傍身。但是个人认为数字经济时代的职业教育不应该仅仅如此,不能用工厂操作工人的思路来培养数字时代的孩子们,会做不在唯一要求,应该给孩子们未来更多的可能,以及掌握更多可迁移学习的能力。

    当下是数字经济初期,对于教育部在产学研相关政策的尝试也证明了是一次机遇,教育也会更深入的垂直化发展。在这方面今年我也下了很大的功夫去做数字化教育的研究,也欢迎小伙伴们交流。

     

  4. 2021年标注行业的转折年

    • 数据标注行业是一个服务外包行业更是精细化运营的行业,服务外包的意思很明晰了就是一个利润率相对固定,几乎没有溢价率的可能。精细化运营的意思就是基于项目整个流程都需要精准把控,一个环节失控都会导致成本的失控。

    • 数据标注行业作为服务外包,就高度依赖下游客户订单,所以如果没有接触过客户就不要贸然加入了,建议行业群仅仅是交流就好。

    • 数据标注行业大部分需要垫资,所以一定要有较为充足的资金量储备。

    • .......

 

以上就是对2020年的回顾以及2021年的展望,不管用什么样的思路去解决目前行业的问题或者什么样的路径去更好的实现数字经济,都是我们参与其中的这代人的幸运,可以用我们自己的方式去试图塑造历史、去推动发展,或许这才是最大的乐趣。希望2021年依然在行业内砥砺前行的小伙伴可以乘风破浪、披荆斩棘,在自己梦想的路上一路狂奔。

 

2020年感谢小伙伴的支持、2021年我们一起加油!!!

 

 

图片

 

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI数据标注猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值