迎元旦,上级领导准备在网站上进行一元促销活动,平常日PV400-500,经过升级后,网站能承受日PV150w,同时在线独立访客达到2w,现把升级过程做以下记录:
服务器初始配置:
web1节点:8核16G
web2节点:2核4G
RDS主 RDS从采用默认配置:最大连接数:150个,IOPS设置为600
1.12月25日上午11点,促销活动开始:
现象:网站PV UV开始逐渐增加 CPU占用率飙升,php-fpm 进程设置为50个
措施:升级硬件:web1 web2:16核16G
2.12月26日:
现象:CPU占用率继续飙升
措施:
(1)nginx设置网站静态文件映射
(2)RDS1:最大连接数:1500个,IOPS设置为3000
(3)php-fpm数量设置为3000个
新问题:
网站频繁502错误,cpu占用率突增突降
新措施:
php-fpm进程又重新调整为50-100个
3.12月27日-28日
现象:前端负载均衡器SLB压力突增,最高达到5G/秒,出现DDOS攻击和CC攻击。
措施:购买阿里云“高仿IP”服务,防止DDOS攻击和CC攻击。
4.其他问题:
现象:注册没有手机验证,出现大量的无效用户注册,下单。
措施:注册加手机验证、图片验证、滑块验证
现象:首页打开缓慢,整站图片加载慢。
措施:做全站CDN加速,首页图片压缩。
5.待解决问题:
同一会员账号同一秒频繁下单(通过非正常手段频繁刷单)
短信验证码地址被频繁刷新
6.运维人员反映的其他问题:
推测可能是ecstore网站程序问题,待以后研究优化。