《Scuba: Diving into Data at Facebook》阅读笔记

《Scuba: Diving into Data at Facebook》阅读笔记

论文着重点
  1. 系统的数据模型
  2. 响应时间
背景

scuba主要是存储用作数据分析、出报表的日志的,基于这一点,使得scuba拥有以下特性:
1. 响应时间必须快,不然相关人员发起一个查询,要半天才能给出结果,非常影响效率
2. 可以允许丢失数据。由于数据量大,丢失少量数据并不影响结果。
3. 体验好。包括提供的API,GUI界面等。

数据模型


  1. 表结构根据日志自动生成,因此并没有创建表的语句。
  2. 不同的分表表结构可能不一致,有些字段这个分表有,那个分表没有。这个没关系,如果遇到没有的字段,通通当做null值处理。
  3. 表的schema可以根据用户的需求自动调整。

It is common for there to be 2 or 3 different row schemas within a table or for a column to change its type overtime. Together, these two differences let Scuba adapt tables to the needs of its users without any complex schema evolution commands or workflows. Such adaptation is one of Scuba’s strengths.
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值