游戏运维日常名词解释


开服:

即由运维部署一个新的服(即新的程序)后,由运营人员选择一个合适时间,对外开放一个新的服(即一个新的游戏区)


合服:

即在当游戏各个服的玩家减少的时候,为了增大玩家的数量,让他们在自已的区内能看到不同区的玩家

则我们把所有程序集中迁移到一个服,然后,把每个服(即程序)的数据导入到同一个服的数据库里面,称之为合服


迁服:
即把我们的机器程序与数据库迁移到一台新的机器里面,称之为迁服


1、什么是运维?什么是游戏运维?


1)运维是指大型组织已经建立好的网络软硬件的维护,就是要保证业务的上线与运作的正常
在他运转的过程中,对他进行维护,他集合了网络、系统、数据库、开发、安全、监控于一身的技术
运维又包括很多种,有DBA运维、网站运维、虚拟化运维、监控运维、游戏运维等等

2)游戏运维又有分工,分为开发运维、应用运维(业务运维)和系统运维
开发运维:是给应用运维开发运维工具和运维平台的
应用运维:是给业务上线、维护和做故障排除的,用开发运维开发出来的工具给业务上线、维护、做故障排查
系统运维:是给应用运维提供业务上的基础设施,比如:系统、网络、监控、硬件等等


总结:

开发运维和系统运维给应用运维提供了“工具”和“基础设施”上的支撑
开发运维、应用运维和系统运维他们的工作是环环相扣的

2、在工作中,运维人员经常需要跟运营人员打交道,请问运营人员是做什么工作的?
游戏运营要做的一个事情除了协调工作以外,还需要与各平台沟通,做好开服的时间、开服数、用户导量、活动等计划


工作:qqandroid平台全服维护


事件问题:java内存溢出


qqandiroid平台许多服出现游戏登陆时卡69%,89,打印日志出来,发现进程端口已不在

查看系统日志,原来是内存溢出的问题,导致杀死了java程序


解决方案:

先查看系统内存,看看有哪一些没有用的服务和进程把他关掉,查看发现nginx和php-fpm是不需要打开的,第二个问题,MySQL内存也给的太大了,24G的系统内存,我们一台机跑五个服,一个服就给2G,然后又给了十五G给MySQL,参数innodb_buffer_pool_size = 15,你说内存怎么可能不爆,再检查一下几台之前经常岩机的新服,发现启动脚本给java的内存比其他机大太多了,旧服300m 2g,而新服却是500m 10G,前面那个参数是启动java时给他的最小大小,后面那个参数值是给java的最大的大小


执行操作:
1、通过top,netstat查看不闭要的进程,我们这里干掉了Nginx和php-fpm
2、调小MySQL的缓冲池大小为8G,原来为15G,
3、修改给Java程序的内存大小
4、开服后给每台游戏服增加 10G swap 空间


所用工具:Ansible
执行人: test

游戏卡90%游戏报网络不畅

这种情况游戏端口和程序尚在,但登陆不了,具体原因找开发帮忙协助调查


解决方案:重启程序