eHarmony 与 MongoDB

Thod Nguyen, eHarmony 公司的CTO,向我们展示了这个世界最大的交友服务网站的用户体验的飞跃式提升。在使用了MongoDB的技术之后,与原有的关系型数据库相比,eHarmony的配对速度提高了95%,同时也使网站增加了进50%的订阅量。

eHarmony现在的主要业务集中在北美、澳洲以及英国。自从公司2000年成立以来,公司一直保持良好的服务记录--------超过120万对配对成功的情侣最终步入婚姻的殿堂。到今天为止,eHarmony已经拥有55000000的注册用户。不久的将来,它们的业务即将扩展到另外的20个国家,相信这个数字很快又会出现快速的增长。

eHarmony雇佣了一些相当专业的数据工程师来迎接未来的众多合作伙伴。网站的用户在注册时候会被要求填写一份详细的问卷,之后,他们的答案将会被用于智能的模式分析,之后产生一个针对该用户的个人档案。之后的数据研究更多是有关机器学习和分析预测,这些研究将被运用到最终的用户配对算法当中来提高配对的命中率。

用户配对的过程可不像Google那样单纯的搜索一个物品或语句,这一过程是“双向的”,并且需要涉及用户之间许多属性比如年龄、地点、教育背景、收入等等的交叉引用和得分。

在eHarmony最初的架构当中,整个系统只使用一个单一的单片数据库来存储所有的用户数据以及配对信息,显然这并不能适应网站业务发展的需要。后来,他们开始用Postgres数据库将配对信息分开存放,这的确一定程度上解决了他们的问题,但是随着网站的潜在配对数据达到了30亿条、25TB数据 /天以后,对一个用户群运行一次完整的配对分析,需要花费至少2周时间。同时,伴随着数据量的增长,数据模型也变得越来越复杂。而算法策略的调整需要整个数据库数据的清空和重载,这不仅增加了操作的复杂度和停机,更阻碍了公司业务的快速发展。

eHarmony明白他们需要一个新的方法,他们的数据库需要具备:

——支持复杂的多属性查询,这是他们配对分析系统最根本的需要。

——更灵活的数据模型,这使得他们可以更精确地运用新的属性。

——大规模的在常见硬件设备的部署,并且不增加现有的设备开销。

 

eHarmony曾经选择Apache Solr作为可能的方案,但因为双向搜索而不是单向搜索,选择Apache Solr的计划搁浅。之后,Apache Cassandra也因为API难以兼容现有数据模型、读写操作的不平衡等原因退出了竞争。

最终,在谨慎的评估之后,eHarmony选择了MongoDB。

MongoDB除了能满足上述的三个需求之外,还通过MongoDBEnterprise给予了eHarmony许多企业服务的支持。

Thod通过这次的MongoDB和eHarmony的合作,也总结出了给读者们的几点意见:
­——早使用MongoDB,MongoDB可以提供绝佳的数据模型应用,分割以及发布产品。

——测试时,运用产品数据和查询功能。随机杀死节点来测试数据库应对多个失败情况的反应。

——在隐身下运行,对比现有的关系型数据库来了解MongoDB处理大量数据的表现。

 

当然,MongoDB也不是eHarmony的全部数据管理架构,他们的数据工程师团队还将MongoDB与Hadoop相结合,此外还结合了Apache Spark和 R语言。

这次数据库转换的ROI已经得到了验证:

——95%更快。配对速度提高了95%,配对全部用户群的速度从2周缩短到了12小时。

——30%更高。潜在配对人的交流度提高了30%。

——50%增加。付费用户增加了50%。

——60%增加。单一网站访问量增加了60%。

 

当然,这个故事并没有这么快结束。随着eHarmony准备扩大到其他的20个国家,他们也打算扩大他们的数据研究团队。同时他们将开始添加基于地理位置的服务,以此来充实他们的移动端体验,而这也正好符合MongoDB对于地理空间索引和查询的支持。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值