数据挖掘技术对游戏运营的影响

陈棋煌 郭培华

浙江汽车职业技术学院

摘要:中国互联网是国际互联网的重要组成部分,也是人口基数最多,发展最为广泛的互联网之一,正因为此,起源西方的电子游戏产业自1994年开始,也搭乘中国网络这趟顺风列车迅速在国内发展壮大。但如何在如此众多款式的游戏产业中分到属于自己的一块蛋糕,则需要游戏运营商花费更多的资金和精力,本文通过对游戏项目开发过程中涉及到的需求分析、数据仓库搭建、游戏运营过程中所面对的玩家流失等现象进行分析,给出解决方案,简要阐述了数据挖掘技术对游戏运营的影响。

关键词: 数据挖掘、数据仓库、游戏运营

引言:互联网发展到今天,网络游戏成为了互联网中不可或缺的组成元素,随着计算机(电脑)普及率的提高,众多游戏类型也越来越多的进入到千家万户,影响成千上万的人们,尤其是当今每个家庭的新生代,无时无刻都在与游戏为伴,甚至影响整个青少年时代性格的形成,但无论是客户端下载版,还是网页版,又或者是手机版,通过收集数据去分析玩家的习惯特点,以便能够掌握玩家更多的兴趣爱好,拓宽游戏视野,更多更久的留住玩家,进而使游戏款式经久不衰。已然成为每个游戏运营商所必须面对并解决的主要问题之一。

一、需求分析阶段

任何一款产品或项目在确立之前都无法忽略对其需求分析的研究,游戏亦不例外,每一款新游戏的发布,从最初的提案,到最后正式发行维护,总要经历环境因素、功能和性能分析、成本/效益分析几个阶段,而在后期规划阶段则需要关注搭建运营环境所需的场地规划、网络设备规划以及游戏运行所需要的操作系统及游戏版本升级兼容性等信息。

再者,游戏运营过程中所涉及到的在线玩家人数是否受到外界因素影响,如何使玩家的个人信息得到更好的保护,现阶段游戏人物角色和主要(辅助)线路是否满足玩家需求的,联盟公会好友功能是否可以满足现阶段游戏的发展等问题,都需要游戏运营商建立相应的预警机制,为防止玩家过度流失,也应建立相对应的模型,并对玩家按模型进行分类,采取差异化营销策略。

在此基础上设立用户流失模型就显得相当有必要,另外在设立模型过程中可对项目模块化,分别进行评估,这样可在一定程度上避免由于设立目标过大而无法在规定的时间里完成。需求分析如下图所示:

需求分析
二、数据挖掘阶段

1.数据挖掘和数据仓库的相关概念

数据挖掘[1](英语:Data mining),又译为资料探勘、数据采矿。是从大量的数据信息里自动甄别有特殊关系性的过程,是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。通常与计算机科学有关,通过前期的信息收集、信息检索、信息分析、机器学习等技术手段实现对数据的分类规整,以达到我们所需求的目的,同时可根据规整后的信息建立数据模型并加以存储。

而数据仓库的建立则成为数据信息的最佳存储设备,所谓数据仓库,可将其理解为规整后的数据信息进行存储的地方,出于对数据信息的分析及决策支持为目的,提供查询、检索等服务,并对游戏后续的运营成本改进和版本的维护更新提供指导,类似于我们生活中存放物品的仓库一样,根据不同的数据将其存入相对应的数据仓库中,根据实际需求对数据进行存取。

2.数据仓库的搭建

古人云:“兵马未动,粮草先行。”同理,数据挖掘虽然是整个游戏项目最重要的一个阶段,但如果没有数据仓库的搭建作为基础项目,花费大量人力物力得来的数据想要在较长的时间内循环调用,可能就会导致游戏在运营过程中出现各种我们无法预料的问题,所以数据仓库的搭建在本文中的观点是需要提前搭建。数据模型通过抽象的实体与实体之间的某种特殊性联系,将现实中的事物的相互关系进行映射,而数据仓库模型作为一种特定的模型,一般分为以下几个层次,如图1所示:

图 1

3.游戏玩家的分群和数据收集相关

1).一款新的游戏投放网路运营,必然少不了用户注册这一重要组成部分,这里我们常见的可以分为人民币玩家、非人民币玩家、特殊玩家及其他玩家类型(注:根据国家法律,为加强对未成年人的保护,需要特别进行身份验证,以便在超过规定时间后启动游戏保护程序。)

以2016年1月19日国家统计局公布的经济数据:2015年全年国内GDP5.2万元为参考依据,则国民日均142.4元,设定人民币玩家参考值为>=142.4为基数,如图所示:

玩家类别

日均储值额度(元)

日均消费额度(元)

道具购买力度(元)

活动参与度(元)

人民币玩家

>=142.4

>=142.4

>=142.4

>=142.4

非人民币玩家

0-142.4

0-142.4

0-142.4

0-142.4

特殊玩家

0

0

0

0

其他

0

0

0

0

参考图 1

2).数据挖掘对数据来源的依赖度相当高,为了实现数据挖掘的目标,保证数据来源的质量,我们要尽可能的用各种方法来搜集用户信息,常见的我们可以用网络爬虫[2]或网络蜘蛛从玩家的注册时间、地点获取玩家常用来上线的IP地址,根据IP地址所在的位置,利用数据分析的维度来确认玩家所在地区的注册人数、年龄、性别,通过划分玩家IP地址范围确认玩家地理位置。

在数据收集初期,有些还需要专职人员通过最原始的方法人工获取目标信息,拿到数据后对数据进行处理,并分类规整,比如说收集对象的年龄范围、职业、生活习惯以及对游戏的认知度,一些专业的游戏公司甚至可以通过对数据分析判断潜在的玩家数量,据此估算游戏发布后所带来的经济收益。如下图2所示:

图 2

4.玩家选择游戏时的相关特点

大多数玩家并不知道自己为什么要玩游戏,或者说在游戏中得到什么,而且对游戏的定位比较盲目,包括本人在内深有同感,你可以说,我们读书或工作太累,玩游戏使我们放松;又或者说我是职业玩家,可以通过游戏装备材料的交易赚钱等等。如下图3所示:

图 3

上述为常见入门玩家特点,可据此特点,对游戏的可玩性和拓展性针对特定的人群进行推广,亦可根据玩家不同的年龄段设置多个代言人等加大推广力度。

5.玩家流失原因及数据统计

类似于生命周期一样,游戏也同样会带有其自身的周期循环特性,拥有大量玩家是整个游戏系统赖以支撑运转的重要组成部分,一款新的游戏是否昙花一现,还要看游戏本身是否能在众多老牌游戏中留住更多的玩家,挣得自己一片天地。常见玩家流失原因如图4所示:

图 4

6.游戏玩家流失预警机制

玩家新入与玩家流失都属于行业正常现象,例如横扫全球的列王的纷争(COK)也不例外,即便是小米总裁雷军亲自率领军也无法阻止大批玩家流失现象的发生,但是于公于私,玩家流失是每个运营商都不愿意看到的事情,而如何防止玩家流失必然是其必需要解决的问题。

对流失玩家数据进行收集,针对流失人群进行分类,一般玩家流失都会有被挽留的过程,有玩家盟内成员进行挽留,更有运营商通过种类繁多的活动吸引新老玩家继续留在游戏中,但有一点,如果获取一个新玩家的成本远高于挽留一个玩家的成本,这时候流失预警就具有重要意义。这里我们可以用树形结构对玩家在游戏过程中常见的活动加以跟踪记录,并根据活动的特点设立相应的对策。如下图5所示:

图 5

7.模型的建立与应用

1)建立模型

数据挖掘项目的模型建立通常都要经过三个阶段:建立模型,测试并调整模型,应用模型。使用合适的模型建立技术可使问题看起来更为简单明了,进而更容易使我们理解。常用技术:决策树[3]

另外,使用人工收集或者网络爬虫(蜘蛛)所收集的信息并不尽完备,但是我们又需要这些数据的时候,要尽可能设定这些数据中多数可用并且正确。在游戏运营过程中,总会需要根据不同的阶段来调整运营策略,由于数据是随着时间的变更而变更,此时可能就需要将各个阶段所建立的模型加以组合,在游戏中一般分为开发阶段、内测阶段、公测阶段和发布运营阶段,此时则需要不同的模型对数据进行分析。

2)模型的测试与调整

每一个模型建立并不都是完美的,也不是所有的模型都一概而论,游戏运营也一样,想要一款游戏经久不衰,并且新入玩家能够留在此款游戏,跟随玩家需求及国家相关政策对游戏更新设计,模型测试与调整就显得尤为重要。

例如国家出台的相关政策对游戏的影响?游戏更新版本时需要符合什么样的法律?网络游戏或者手机游戏在国内的发展速度,哪一个更有优势,新生代人口规模、分布区域、年龄结构等。如下图6所示:

 

图 6

3)模型的评估工作

经过测试调整后的模型是否真的能够达到我们设立模型初期就预期过的目标,则需要长时间的应用才可以判断其,传统行业一般是在模型应用1年后作出评估。模型对游戏运营阶段的影响是否可以跨越平台应用到其他的行业,生成的结果对其他行业是否具有参考价值,也是我们需要考量的一个因素。

后期对模型生成的结果加以改进并应用,同时根据结果对数据仓库的变量做适当的调整修复,以满足我们对日常数据分析的需求

4)发布应用模型

在以上阶段准备完成后,则进入最后的发布运营阶段,一般包括游戏版本的更新、设备维护、玩家意见收集、游戏内活动和运营收益,甚至可以设立周边商城对游戏道具(活动道具)进行交易,发布日常或者季度报告等,及时反馈运营中出现的各类在建模初期未涉及到的信息,及时更新数据仓库等,将游戏市场最大化,发掘潜在玩家,以确保该款游戏能够更久的生存下去。

简易数据流程图

图 7

结束语:

数据挖掘并不能解决所有的问题,它只是人们用来对某个行业做分析策划的一个工具,通过对源数据的分析,发现其可能存在的问题,设定初始值并加以验证,以便得出我们想要的结果。一个良好的数据挖掘习惯,很大程度上可以是行业在一定程度上减少风险投资

游戏运营也一样,游戏中所存在的不确定因素太多,数据挖掘技术仅仅是作为辅助工具为运营商提供些许的参考,并不能完全支撑整个游戏的运营维护,故而想要做好做精一款游戏,留住更多的玩家,则与运营商自身的经营方式和态度密切相关。

参考文献:

[1] Pang-Ning Tan/Michael Steinbach/Vipin Kumar

译者:范明/范宏建,数据挖掘导论,人民邮电出版社,2010.12

[2] 周志华,机器学习,清华大学出版社,2016.1

[3] 百度百科。

 

[1] 摘自百度百科

[2] 网络爬虫:是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。—摘自百度百科

[3]决策树(decision tree)一般都是自上而下的来生成的。每个决策或事件(即自然状态)都可能引出两个或多个事件,导致不同的结果,把这种决策分支画成图形很像一棵树的枝干,故称决策树。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

轩宸暨

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值