大型电商网站两年之技术总结

        转眼已经是在互联网第三个年头了。跟公司一起成长,从经历过2次双十一大促,还有数不清楚的小促销。跟公司一起遇到了不少坑,这里站在宏观的角度为公司总结下经验和教训。

  1. web架构,几个问题比较突出,
    • 一个是经常出问题的就是数据库开发和运维不规范。有次大促数据库挂死,时候分析原因是备份脚本有问题,把某个表的索引删除了。因为数据库出问题是多次,这方面web应用的dba肯定是有问题的。基础支撑部门的数据库研发团队也没起到应有的作用。
    • 另外一个就是监控不到位,曾经出现redis的虚拟内存过高没及时发现,物理机又开了swap,这个时候redis的tcp链接响应很慢。虽然后面关闭了物理机的swap,算是把这个问题规避了。公司在应用监控做了很多,但是物理资源监控不到位的问题很突然出。
    • 外部商家在大促前上传了很多高清图片,但是没有配置cdn,结果导致大促期间主站的带宽收到了冲击
    • 安全审计,对于黄牛刷机出过问题。
  2. 云计算平台,遇到两个比较大的坑,
    • 一个是老的centos6.3的bug引起宕机,经常有物理机宕机。物理机升级效率比较低,运维挨个跟涉及业务确认虚机是否可以重启,然后选择凌晨时间关闭物理机做冷升级,确认问题后有3个月以上才把所有物理机都升级一遍。
    • 另外一个就是IaaS选择有问题,开始为了快速上线选了cloudstack,后面全面转向openstack,cs向os的vm迁移不好解决。
  3. 基础设施和硬件
    • 网络规划有问题,比较混乱。大型企业的基础设施规划,网络最重要,软件可以升级,服务器可以买新的,网络有缺陷,基本是伤筋动骨的。网络出个小问题,服务马上出大问题,具体的问题就不方便吐槽了。
    • 开始全部是300g sas盘的机器,存放冷数据性价比不高。

       以上只是一些技术问题和经验总结,相信这些技术问题在初期也都遇到过,即使技术成熟度比较高的公司,例如阿里,也会遇到过类似的问题。公司目前在架构和管理上还是有了明显的进步。去年开始大促已经没有遇到的大问题了。在此,自己的一点总结是,构建一个高并发的互联网电商网站,目前的技术,已经是比较成熟的。但是这块技术不可能像传统IT一样,通过购买些高性能的硬件和解决方案就可以搞定,而是必须拥有成熟的研发团队。主要还是因为web服务的高度的个性化和定制化需求导致。
大公司需要有自己的研发团队,而是否能取得一个好的研发的效果,这里面,除了资金投入之外,科学、合理、人性化的管理因素,非常重要。
       管理方面,也举个简单的例子,就是某次促销,数据库出问题了,一堆人围在dba后面等dba定位故障。咱们不是专业搞管理的,但是笔者觉得这种情况在我国的大小公司里面都很常见,但是显而易见的肯定是管理哪个地方出了问题。一堆领导堆在一起,肯定不是最快定位问题的方法,不是国军军官拿着枪,高喊弟兄们给我顶住,这仗就能打赢。关键时候出了关键问题,关键负责人第一时间出现肯定是对的,但是,不要有事没事都来凑热闹,本来小问题也成了大问题。各司其职,井然有序,处乱不惊,方能经得住风浪。
       另外一个管理的例子就是规划。技术设施的规划,一定要要远见性,否则积重难返,网络问题最明显。规划的关键是人,只有经验丰富,卓有远见,崇尚技术的专家,才能提供合理和科学的架构和规划。以笔者的了解,业内知名友商,虽然在业务上领先,但在IT的人事管理和规划方面并不如我司。例如该公司负责SDN的架构师,对vlan的概念不懂。
        最后,想起康恩定律。不只是传统软件公司如此啊,互联网公司,看来也有类似的情况,老板和核心高管的个人意志和管理风格,很大程度上决定了公司的管理风格和组织架构,最终影响了该公司的产品特色和服务质量。当然,时势造英雄,站在互联网的风口浪尖上,本文吐槽的各种问题,均不是关键,呵呵。
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值