项目一:服务器上线
负责公司新服务器上线搭建系统环境及软件环境
1,根据现有配置部署工具(ansible+playbook)
2,结合应用系统环境需求定制部署模版(系统环境初始化、系统优
化、服务软件安装、配置模板) 制作一键执行脚本 playbook,使用
roles 细化不同模板中的不同任务
3,在新批量部署的服务器上部署 LNMP 环境、编制 Nginx 配置文
件并批量化部署;
4,自动化部署实施完成服务器上线
5,根据定制的检测模板对自动化部署效果进行检验
项目二:web 架构调整
web 服务器架构调整(从单点到集群的设计)
需求: 解决网站多个项目 web 服务器单点故障的问题
职责:
1 ,研究多种负载均衡方案 主要针对 lvs+keepalived 及
nginx+keepalived 进行研究
2,编写新架构方案实施项目书与实施日程
3,新系统部署与日常维护把公司原来的多数单点服务器变成了集群,提升了网站的稳定性与高并发的应用场景
项目三:EFK 日收集审计
服务器日志审计项目提出与实施
1,出于安全权限控制从而实施对所有用户日志记录方案 ELK2
2,搭建 EFK 日志收集管理系统
3,通过 EFK 实现对所有服务器系统、用户、服务进行日志审计并将
记录集中管理
4,实施后让所有运维和开发的人员都根据自己角色在 Kibana 查看
相应日志,管理员管理所有日志,实现安全对服务器日志的收集、分
析、审计。
项目四:批量分发
实现全网服务器数据批量分发与批量管理
需求:
公司服务器逐渐增多,因此管理起来很麻烦,于是提出解决批量分发
管理解决方案,进行全网服务器数据分发与管理
职责:
1,针对 ansible 配置自动化工具及 ssh key+rsync 两套分发管理方
案研究,最终选择简单易于维护并且强大的 ssh key+rsync 方案
2,找一台 IDC 内网服务器,作为分发机器,对固定普通用户做 sshkey
认证(注意不是 root),需要 root 权限,通过 sudo 来控制,减少安全隐患。
3,对于分发机进行安全配置,例如,去掉外部 IP,开启防火墙。实
施完毕,运维管理的效率提高了很多,因此得到了公司的嘉奖。
项目五:用户安全管理
服务器用户权限管理改造方案与实施项目
需求: 解决公司 root 权限泛滥问题
职责:
1,提出权限整改解决方案,改进公司 root 权限泛滥的现状
2,召集大家开会商讨并确定方案后推进实施
3,实施后使得公司的权限管理更加清晰了(总结维护),从根本上降
低了内部操作等不规范及安全隐患的发生。
3.1,管理用户权限 通过 sudo 来管理权限的,不论是运维还是开发,
一般都不会给 root 权限,只有核心级开发或者研发总监或以上级别
的才可能给相应服务器级别的权限;对核心运维或者运维总监才会给
root 权限
3.2, 规划服务器的时候对普通用户规划 普通用户是根据项目来的,
在不同公司它的项目产品线不一样。公司只有十几个产品线,为每一
个项目建立一个普通用户,因此不论 nginx 还是 tomcat 都是跑在普
通用户下。
3.3,公用服务权限规划 公共服务也运行在普通用户下,总的来说是
这样的,运维做运维的事情,开发做开发的事情。运维负责网络系统,只要系统没有故障,只要网络没有故障,只要系统资源还够用,那么
运维的职责就到位了。而公司的理念是项目负责制,也就是说每个项
目的责任人是开发,运维大概占 30%-40%的责任。的开发占 60%的
责任。当进程上线的时候,这个服务是由普通用户跑的。它的每个站
点目录都是普通用户的权限,也就是 700 的权限普通用户,这个是
最安全的。无论是项目的启动,停止,以及代码上线,日志收集,日
志分析都是通过进程跑的普通用户实现的。在管理这个项目的时候,
可以把开发的用户加到这个项目组里面,这样负责相应项目的开发人
员就有对应项目的所有权限。
项目六 运维工具--工单系统
宝企通IT服务作为智能化工单系统龙头,拥有多年优化SLA经验,能够有效提高员工对IT的服务满意度。是一款支持SAAS、本地化部署、源码交付的运维工单系统(SAAS免费试用,企业微信--工作台--添加应用,搜索“IT服务”,排名第一的就是,或添加顾问:添加我为微信好友)。目前是全网众多企业选择的工单类产品,支持手机验证码或账号验证,员工自助修改域账号密码,具备智能化派单模式工程师响应快减少员工等待时间。自定义知识库可提升工程师专业技能水平,帮助工程师迅速判断员工问题,极大提升员工报单体验。系统还能够大幅提升职能部门可以服务的用户数,有效降低专业人力成本开支,提高业务执行效率,展现工作成果。产品服务好能为用户免费开发个性化需求,连续多年被魔力象0评为leaders位置,市场占有率爆发式增长,特别是最近在搞活动,性价比非常高。