根据《2022年中国游戏出海情况报告》显示,2022 年上半年中国国内游戏市场收入较 2021 年同期减少 1.8%,国内游戏用户数量增长达到瓶颈,较 2021 年同期减少0.13%,但中国自主研发游戏的海外市场实际销售收入达到89.89亿美元(约合 642.52亿人民币),连续7年同比增长。
虽然中国游戏厂商凭借自身的优势取得了不错的成绩,但面对瞬息万变的国际环境,考验也在不断升级。越来越多的国家和地区相继出台或准备制定与个人信息数据保护相关的法律法规,“游戏买量”变得越来越困难,导致出海厂商的买量成本激增。同时,游戏企业的盈利能力也是各个国家重点关注的对象,正如欧洲议会议员Laurence Farreng所说:“电子游戏是我们的文化经济中最有活力的组成部分,并且是新冠疫情危机中唯一正向增长的领域。”
面对如此激烈的市场竞争,对游戏公司来说,“用数据指导经营”是破局的“基操”。如何让数据更加高效、准确、及时的展示洞察,发挥业务价值,成了大家重点探索的议题。StarRocks及其商业化产品镜舟数据库作为中国领先的“极速统一”分析型数据库,可为游戏行业的多种业务场景提供数据原动力,助力中国游戏出海“玩得转,赚得爽”。
随着市场占有率快速提高,StarRocks成功在多个业务场景得到了落地,基于大量的经验和实操,镜舟科技的工程师针对以下典型的应用场景为出海游戏企业,提供了对应的应用方案。
场景一:用户分析
场景下,如何让人群圈选和画像分析获得10倍性能提升?
如果能够精准定位、确立玩家群体的兴趣和爱好,无疑能够获得高效的回报。StarRocks的多种功能创新,让高效数据处理变为现实。
传统分析方案的不足主要体现在如下方面:
-
数据分析性能不足:游戏用户维度指标特别多,业务复杂关联查询分析的需求越来越多,需要在业务代码层面做兼容才能得到相应的分析指标。
-
实时分析场景不足:主要体现在运营推广等数据实时清洗出现延迟,影响到游戏运营和广告投放的策略。
-
Elasticsearch并发性能不足,不支持标准SQL,使用门槛比较高。
-
需要维护多套组件,运维成本和资源成本高。 StarRocks提出的全新解决方案,对传统方案的不足逐个击破,实时快速进行用户分析,快人一步得到用户洞察。
新方案的优势主要体现在以下几点:
-
数据可以实时更新,通过主键模型可以高效完成Upsert操作,实现新用户信息直接插入,已有用户信息快速更新
-
多表关联性能优异,Bucket Shuffle Join、 Colocate Join等分布式Join提升Join性能。
-
StarRocks提供的漏斗函数、留存函数等丰富的行为分析函数,支撑了行为分析场景,可以轻松实现如留存、漏斗等分析操作。
-
丰富的Bitmap函数支持,不仅可以对用户实现高效精确去重,还可以利用Bitmap按位计算求交集、并集、差集,对复杂人群快速圈选。
-
高性能的外表查询,StarRocks外表联邦分析性能优越,让内置表和外表的实时关联成功落地,可以支撑多种数据建模方式,多个维度分析数据。
场景二:运营分析
场景下,如何助力出海企业调整运营的方向,增加游戏的曝光量,打造自身品牌影响力?
游戏业务的品类和产品数量多,环境复杂。面对日新增数据量在百 T 万亿级别的挑战,指标分析平台不仅仅要满足活跃、付费、新增等基础用户行为指标的分析,也要处理各种游戏内的复杂数据,包括对局数、道具产出、消耗等对局情况,同时还需要基于海量用户行为数据支持运营活动。
经调查,游戏业务对实时分析的需求越来越强烈,需要多维度、更及时的数据来支撑游戏运营决策,希望能够将实时和离线业务统一分析,而传统的运营分析解决方案有如下问题:
-
原有的解决方案依赖组件较多,架构偏复杂,运维难度大。
-
传统方案以 Apache Kylin 为核心,随着业务和技术的发展,Apache Kylin 越来越难以满足业务方对指标灵活性和时效性提出的更高要求。
-
Impala或者Presto负责明细查询下压,但是性能不足,并发不够。
-
关联分析场景支持弱,目标指标的明细数据需要单独获取。
StarRocks 提出的全新实时分析解决方案,大幅度提升数据分析响应时间,毫秒级别结果即刻呈现。利用物化视图替代 Apache kylin 的指标预聚合,当用户通过指标组合生成的 SQL 命中指标表后,直接查询对应的视图表,达到毫秒级别的响应;当没有命中指标时,可以通过 Bitmap 丰富的函数,对 StarRocks ods 层的数据表按位计算求交集、并集、差集等操作,实现毫秒级别的实时分析。
同时,StarRocks新方案支持丰富灵活的导入方式,让业务系统成功摆脱架构重、成本重的Hadoop生态,运维更简单,成本更低,也实现了数据源统一、指标统一,避免口径不一致和数据孤岛等问题
场景三:游戏风控
场景下,StarRocks如何在风控全链路实现实时分析?
游戏行业黑灰产猖獗,变化频繁形式多样,需要数据分析产品能对接的多种数据源,且需秒级完成数据导入;复杂聚合和关联查询需求量大,要求低响应延迟并能快速对接生态内的其他风控系统。而目前的通用风控技术风险识别能力弱、单点防御短板、黑产攻击多变,影响业务正常推进。
针对上述痛点,StarRocks提出了全链路联防联控的风控理念,通过实时多维分析来解决风险识别能力弱的问题,通过实时对抗来突破单点防御短板,通过联邦查询的能力,关联外部存储明细,获取尽可能多的信息,应对黑产攻击的多变的现象。
StarRocks新方案的具体优势如下:
-
将多个数据源通过StarRocks的联邦查询能力统一起来,实现秒级别的关联分析。
-
提供了毫秒级别的查询分析能力,为风险感知、风险识别、风险处理、风险回归提供了高时效性保障。
-
StarRocks多维分析的能力,以及bitmap函数,让使用者可以从不同维度去识别风险。
-
整条风控链路的实时性,让前置业务为后置业务产出事前特征,避免后置业务风控检测冷启动;后置业务为前置业务提供事后特征成为现实。
目前,StarRocks和镜舟数据库已服务了业内多家知名游戏公司,例如三七互娱、波克城市、游族、腾讯游戏、欢乐互娱、龙创悦动等均已上线 StarRocks 并在持续扩大使用。此外,腾讯游戏公共数据平台也是 StarRocks 社区的积极共建者,从游戏业务视角出发,打造更加符合游戏行业需求的数据库。莉莉丝与米哈游等业内玩家也曾对 StarRocks 产品提出肯定,未来我们将不断创新,与更多出色的游戏公司合作,为国产精品游戏贡献力量 。
案例1-三七互娱
借助StarRocks实现用户画像分析
随着业务发展,游戏用户维度指标增多,导致索引间复杂关联分析的场景增多。 Elasticsearch 在这种场景下,支持能力较弱,部分业务需求的取数工作需要研发支持,才能得到相应的分析指标;例如 LTV 这些分析指标,高并发查询时间周期特别长,这类查询的响应特别慢;实时分析场景不足,主要体现在运营推广等数据实时清洗出现延迟,影响到游戏运营和广告投放的策略;业务发展使数据快速膨胀,线性扩容成本也比较高,迫切需要对现有的架构方案进行升级。
传统方案
传统方案中使用Elasticsearch存储用户画像数据,来提供服务应用查询,中间的Kafka作为消息队列,经过 Logstash 消费到 Elasticsearch,供其他业务团队使用。而使用 StarRocks 的新方案后,读写性能大幅度提升,千万级维表关联查询秒级返回,数据实时同步延迟低,完全超出实际场景的使用预期。
引入StarRocks后的新方案
同时,StarRocks 内置多种导入方式,性能高效,测试使用 Broker load 导入 Hive 十亿级数据 ,120 分钟就能完成处理,资源占用低,也解决了旧架构读写的问题;提供外表关联,异构数据源的联邦查询能力。其中 Hive 表外表查询性能可以达到 Presto 的6-10倍。
案例2-波克城市
借助 StarRocks 搭建游戏分析平台
游戏分析平台主要是分析游戏相关的评论,为游戏调优、舆论风控提供数据支持,每个月更新7000-8000万数据, 每天几百万条数据。新游戏发布,舆情数据量会特别大,高峰 QPS 超过500,峰值写入数据一亿行,查询字段多,最长会对一个月以内的数据进行查询操作,会做汇总,也会查明细,10-20 个查询条件,多表关联较多。
波克城市现有架构无法满足大数据量的查询需求,主要体现在:
-
使用组件过多,运维难度大,数据的增删改非常不方便。大数据量的即席查询较慢,Impala SQL 优化器比较粗糙,SQL 编写稍不规范,就会产生不必要的资源开销,导致查询卡死
-
Impala 自身存在一些缺陷,在表数据或者表结构更新的情况下,需要手动刷新元数据才能查询到最新的结果,非常不方便,并且大多数 BI 系统也不兼容 Impala 数据源。
-
任务执行经常阻塞, YARN 调度资源使用效率不高。
经过对业务需求的梳理,波克城市引入 StarRocks 后的新方案架构如下,收益显著。查询速度提升 3 倍以上,即使是亿级别的表,由于存在有效的索引和独特的分区分桶机制,在多维分析的场景下依然可以做到秒级别的响应速度。
引入StarRocks后的新方案
同时,StarRocks 让运维变得更简单。StarRocks 架构中最主要的组件 FE 和 BE 提供了高可用和水平扩展的机制,即使出现单点故障问题或资源扩充时,也不会对集群的稳定性和数据安全造成的太大影响。StarRocks 还支持多种数据的写入方式,更重要的是支持 95% 以上的增删改操作。
案例3-腾讯游戏
借助StarRocks 实现降本增效
腾讯游戏公共数据平台部为腾讯数百款游戏提供基础的数据平台支撑,利用数据科学的方法,助力游戏在商业化、游戏品质和渠道效率层面进行提升。腾讯游戏业务的品类和产品数量多,环境复杂。面对日新增数据量在百T万亿条级的挑战,数据分析平台不仅仅要满足活跃、付费、新增等基础用户行为指标的分析,也要处理各种游戏内的复杂数据,包括对局数、道具产出、消耗等对局情况。同时还需要基于海量用户和数据进行运营支持。
业务的发展给腾讯游戏数据分析带来了三大挑战:
1 游戏业务对实时分析的需求越来越强烈,需要多维度、更及时的数据来支撑游戏运营决策,希望能够将实时和离线业务统一分析。
2 原有的解决方案依赖组件较多,成本高,架构偏复杂,运维难度大。
3 集群的数据量和计算量的增长并不完全匹配,对计算和存储的弹性要求越来越高。
经过选型评估,腾讯最终选择了 StarRocks 作为数据平台底座。
引入StarRocks后的新方案
引入StarRocks后,腾讯游戏可实现查询时效性提升,秒级响应,同时计算成本缩减一半,让flink流环境和spark批环境两套环境用一套来实现。因为架构简洁、集群高可用,数据自动均衡,可以实现秒级资源弹缩,容器化部署和存算分离,让之前小时级别的资源弹缩下降到秒级别,让运维更加高效便捷、扩展性更强。
为保障出海游戏企业的业务多样性需求,StarRocks和镜舟数据库还与AWS、华为云(亚太区)等云厂商通力合作,为用户提供基于公有云的一站式出海数据分析解决方案,提升存算分离架构弹性伸缩、实时分析综合能⼒。
结语
随着中国游戏产业的持续发展,国内外市场需求的提升以及政策和资本的支持,中国游戏出海的潜力将得到进一步挖掘。国内游戏厂商与国际游戏市场的合作将进一步加深,让我国游戏产业已有竞争优势进一步扩大。StarRocks和镜舟数据库愿和出海游戏企业一同,用数据提升业务价值,共同玩转全球游戏市场!
作为 StarRocks的商业化产品,镜舟数据库提供更便捷的运维、更稳定的使用体验、数据可信度高,产品易用性强。