2020哔哩哔哩大数据面试题整理

网上能搜到的B站的大数据面试题太少了,博主有点找不到了,而且最近B站的校招的效率似乎不是很高,简历投进去一个多星期了,一点反应都没有,别问,问就是在池子里.jpg

1.数仓与关系数据库区别
    1.数据库有相对复杂的表格结构,存储结构相对紧致,少冗余数据,而数据仓库则是相对简单的表格结构,存储结构相对松散,多冗余数据。
    2.数据库在读和写两方面都有优化,数据仓库一般只是读优化
    3.数据库单次操作作用于少量的数据,数据仓库单次操作会作用于大量的数据
    4.数据库支持单条数据的修改,数据仓库不支持
    5.数据库可以和用户进行交互,数据仓库不行

2.数据仓库为什么需要分层?优缺点?
    分层原因:
        1.用空间换时间。通过建设多层次的数据模型供用户使用,避免用户直接使用操作型数据,可以更高效的访问数据
        2.把复杂问题简单化。将一个复杂的任务分解成多个步骤来完成,每一层只处理单一的步骤,比较简单和容易理解。而且便于维护数据的准确性,当数据出现问题之后,可以不用修复所有的数据,只需要从有问题的步骤开始修复
        3.便于处理业务的变化。随着业务的变化,只需要调整底层的数据。
    优点:
        高效的数据组织形式(易维护)
        面向主题的特性决定了数据仓库拥有业

  • 3
    点赞
  • 42
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值