在年初的时候写过一篇文章“2020年数据标注行业回顾及2021年展望”,大体展望了一下今年数据标注行业的竞争及形式,“内卷”加剧。当然这可能也不是数据标注行业个例的问题,是在产能过剩及内循环的背景下必然的阵痛过程,或许很多行业都是一样的。所以利用周末的时间抓取整理了一些数据,和小伙伴们一起看一下行业目前的情况。
“内卷”这个词最近是非常的火,而个人认为数据标注行业的情况也非常适合。我们先来看看“内卷”的定义:本意是指人类社会在一个发展阶段达到某种确定的形式后,停滞不前或无法转化为另一种高级模式的现象。当社会资源无法满足所有人的需求时,人们通过竞争来获取更多资源。而不管是平台方还是团队供应商来说,或许也都陷入了内部的非理性竞争且无法转化为另一种高级模式的尴尬境遇。本文我们就重点通过对相关公司分布及不同时间内对比的角度,就如下几个方面的问题上做分析:
-
数据标注相关公司的全国整体变化情况。
-
各个地方的相关公司变化情况。
-
有多个基地或分公司的相关公司情况分析。
-
行业相关业务需求是否在萎缩?
-
数据标注“内卷”加剧,你还有机会么?
(注:采集数据来源于网络,对比数据采集源相同,采集时间不同。个别地区如有遗留敬请谅解,但整体趋势分析可做参考。)
一.数据标注相关公司的全国整体变化情况
1.全国相关公司分布
图表1:5月份全国相关公司所在地区分布图
2.相关公司总量对比
图表2:2021年1月及5月相关公司总量对比
2021年1月相关业务公司675家,2021年5月相关公司为694家,增长率为2.8%,增长速度非常慢,不如预期。这里我们从两个方面进行思考:
注:上图是涉及相关数据标注业务需求的公司两个月的情况对比,如图可知两个月份重叠部分的公司为253家,1月份相较5月份有62.6%的公司没有在5月份发布相关业务需求,而5月份相较1月份新增了63.5%家公司发布了相关业务需求。由数据可知行业内相关公司流动占比很高,极有可能是存量市场增长放缓或者需求的定向流动加大。
-
存量市场规模增长放缓或不如预期?
这里我们主要关注一点:行业内相关业务公司流动情况
图表3:2021年1月及5月相关公司重叠图
-
存量市场需求相关公司内部变化大?
经过人工对相关需求公司进行标注分析,1月份潜在甲方在5月份中没有继续发布相关人员需求的是226家,占同期需求的33.4%。占比也比较大,很可能说明在这期间相关公司需求没有明显增加,而基础标注岗的人员流动相对比较大,进一步说明相关公司的需求有可能降低或者加大了定向输出。
二.各个地方的相关公司变化情况
1.2021年1月和5月各地区的对比图
图表4:2021年1月和5月城市相关业务公司数量对比
图表5:2021年1月和5月相同城市差值变化图
图表6:2021年5月TOP10地区相关公司数量占比及1月对比排名
注:
-
-
由图表4可知:2个点主要问题:
-
行业内相关需求公司地区总量变化比较大。
-
部分地区公司全军覆没,也有地区新开展相应业务。
-
-
由图表5可知:深圳、上海、北京、合肥等地区业务相关公司在减少,并且北上深减少数量较多
-
由图表6可知:5月份TOP10地区的具体变化,成都、杭州、武汉、天津、西安是相关业务公司增量比较多的城市。
-
三.有多个基地或分公司的相关公司的情况分析
上面分析了全国及各地区的情况,我们基本得出了结论是2021年的前5个月相关业务有可能没有增长或者有下降的趋势亦或者业务加大了定向输出,存量市场中的业务流通已经趋于内部平衡。
所以我们这里来通过数据重点来关注目前相关公司在全国有基地或者分公司的数量以及地方分布,来探究一下是否有可能由于出现了更多的业务定向输出,导致相关公司的人员需求下降。
这里面存在一些暂时无法避免的数据问题,如分公司或基地名称和总公司不一致且公司架构上无实际关联,或如百度山西基地实际内部是由多个不同公司组成等,诸如此类问题都不以同一家公司做统计,统计需求以同一家名称公司不同区域需求发布为基地或分公司,所以具体公司可能会有遗漏,数据和趋势可做参考。
图表7:2021年5月存在需求且分公司或基地的公司数量情况
图表8:2021年5月存在需求且分公司或基地的地区分布
注:通过图表7、图表8可知:
-
-
5月份存在需求且存在分公司或基地的地区数量是35个
-
需求企业自建分公司或基地数量增加
-
多家传统软件服务外包企业也在闷声发展,已悄然占据市场份额
-
多家传统人力资源公司,汇聚了一部分相关需求的市场份额
-
四.行业相关业务需求是否在萎缩?
从目前的数据来看,分公司或基地数量没有明显增加,但是地区分布有所变化,特别是3线以下城市分布变化比较大,在各家快速扩展、政府积极推动的情况下,目前部分地区还是没有找到很好的商业逻辑支撑小城市地区数据服务商发展,这与市场需求放缓应该有很大关系。
对于行业相关业务需求是否在萎缩的问题,无法得出定论。不过基于现有数据来看,存量市场需求定向输出的情况可能在增加,科技公司的自身需求转化成地方资源置换的条件也变成了在市场情况不如预期、产品竞争激烈情况下的可选项。而整体行业规模增长有限,部分地区存在萎缩迹象。
这也是可以理解的,目前存量市场的主要客户都是头部科技公司、各个轮次融资阶段的科技公司及初创科技公司,而今年的整体市场表现一般、融资收紧等因素导致发展放缓也属于正常现象。
虽然相关业务需求是否在萎缩无法定论,但对于科技公司作为成本存在的环节,可以减少成本是必然选择,如果在减少成本的同时还能创造一定价值,那何乐而不为呢?所以数据标注“内卷”加剧,应该是必然。
五.数据标注“内卷”加剧,你还有机会么?
数据标注“内卷”加剧,我们还有机会么?很多小伙伴在留言说了解到这个行业,感觉很有发展且难度不大,想进入行业或者创业。我个人认为任何一个行业任何一个时间点进入都有可能赚到钱,但是要看自己手里的牌有哪些?如何去打?
从2016年数据标注爆发的元年来算今年是数据标注的第五个年头,其实发展时间也不是很短了。有的公司闷声赚钱,有的公司出力不赚钱甚至赔钱,有的公司融资寻求增长、并购、做流水目标是做上市等等,大家各有各的玩法。你手中的牌是什么?目标是什么呢?
这里面把两个我比较感兴趣的公司分布单独列出来作为一个样例参考:
-
软通动力
-
人瑞人力
最后列举一下我个人认为目前比较好的几种方式:
-
基地
-
人力服务
-
产学
以上三个方面也是针对不同角度配合不同资源解决不同的问题,就不单独具体展开来聊了,如果有感兴趣的小伙伴可以私信交流。但如果没有附加资源创业的话,我个人不建议单独来新入行来做数据标注的项目了。
最后我想说对于毕业生来说内卷再严重、就业压力再大依然有同学找到合适的工作,对于行业来说内卷再加剧,依然有小伙伴可以如鱼得水。如何解决“内卷”现象是社会问题,如何生活、发展好是自己的问题。最后希望小伙们都可以找到动态平衡的最佳点并如鱼得水。