• 我的消息
  • 我的博客
  • 我的学院
  • 我的下载
  • 我的收藏
  • 消息
  • 搜索条件:
    点击返回全部
    全部文章 > {categoryName }
    • 通过hive访问hbase中的表

      在hbase中创建表后,我们只能在hbase shell中使用scan查询数据,这对于熟悉SQL的使用者不怎么习惯,不过我们可以在hive中创建外部表来访问hbase表中的数据,例子如下: ...

      转载
      2017-03-04 15:32:48
      450
      0
    • hive外部表

      我们在创建表的时候可以指定external关键字创建外部表,外部表对应的文件存储在location指定的目录下,向该目录添加新文件的同时,该表也会读取到该文件(当然文件格式必须跟表定义的一致),删除外...

      转载
      2017-03-04 15:31:07
      267
      0
    • 大数据工程师面试题(七)

      9. 面试问题: 1.从前到后从你教育背景(学过哪些课)到各个项目你负责的模块,问的很细(本以为他是物理学博士,但是所有的技术都懂) 2.hadoop 的 namenode 宕机,怎么解决 ...

      转载
      2017-02-26 10:02:59
      3637
      2
    • 大数据工程师面试题(六)

      3.14 1、一个Hadoop环境,整合了HBase和Hive,是否有必要给HDFS和Hbase都分别配置压缩策略?请给出对压缩策略的建议。 hdfs在存储的时候不会将数据进行压缩,如果想进行压缩...

      转载
      2017-02-26 09:28:33
      848
      0
    • 大数据工程师面试题(五)

      2)HashMap和HashTable,ArrayList和Vector,ArrayList和LinkedList的区别 1 HashMap不是线程安全的 hashmap是一个接口 是map接口的子接...

      转载
      2017-02-26 08:46:01
      666
      0
    • 大数据工程师面试题(四)

      2.23. 我们开发job时,是否可以去掉reduce阶段。 可以。设置reduce数为0 即可。 2.24. datanode在什么情况下不会备份 datanode在强制关闭或者非正常断电不会...

      转载
      2017-02-19 16:29:53
      1874
      1
    • 大数据工程师面试题(三)

      2.13. 简述hadoop的调度器 FIFO schedular:默认,先进先出的原则 Capacity schedular:计算能力调度器,选择占用最小、优先级高的先执行,依此类推 Fair...

      转载
      2017-02-19 15:39:42
      2302
      0
    • 大数据工程师面试题(二)

      2.7.  用mapreduce来实现下面需求? 现在有10个文件夹,每个文件夹都有1000000个url.现在让你找出top1000000url。 方法一: 运用2个job,第一个job直接用...

      转载
      2017-02-19 14:17:12
      1294
      0
    • 大数据工程师面试题(一)

      1.   选择题 1.1.  下面哪个程序负责 HDFS 数据存储。 c)Datanode  答案 C datanode 1.2.  HDfS 中的 block 默认保存几份? a)3 份 ...

      转载
      2017-02-19 13:46:40
      3089
      3
    • 链表与二叉树

      interface Link { public void add(Object data) ; public Object [] toArray() ; } class LinkIm...

      转载
      2016-10-20 07:56:17
      120
      0
  • 学院
  • 下载
  • 消息