![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据库&数据仓库
有道李
流浪者
展开
-
系统学习hive programming,第五章,操作数据
/** Lee 2013.11.14翻译 《programming hive》 第五章节HiveQL: Queries */ 第五章 数据操作 Hive不允许行级别操作,数据只能被批量导入。加载数据示例:LOAD DATA LOCAL INPATH '${env:HOME}/califo翻译 2013-10-14 14:07:54 · 1472 阅读 · 0 评论 -
Hive 典型的中表内数据除重写法
insert overwrite table store select t.p_key,t.sort_word from ( select p_key, sort_word , row_number()over(distribute by p_key sort by sort_word) as rn from store) t原创 2013-11-04 16:12:08 · 11340 阅读 · 3 评论 -
系统学习hive programming,第四章----表和数据库定义
/** Lee 2013.11.12翻译 《programming hive》 第四章节 Getting Started @page表示 翻译原文页码*/@page 49 Hive 提供一种名为HSQL的方言, 不参考 ASCII SQL标准。 Hive不支持行级修改,故而在HSQL中没有insert , update,delete关键字。 总体来看HSQL和My翻译 2013-10-12 18:15:19 · 4884 阅读 · 0 评论 -
系统学习hive programming,第三章----数据类型,见表
/** Lee 2013.11.11翻译 《programming hive》 第三章节Data Types and File Formats @page表示 翻译原文页码*/@@ page41Hive支持常见的基础关系型数据库类型,同时还支持集合类型(collection data types) Hive支持的基础数据类型====翻译 2013-10-11 17:18:29 · 2814 阅读 · 0 评论 -
hive 大数据 除重问题研究
存量表: store增量表: incre 字段:1. p_key 除重主键2. w_sort 排序依据3. info 其他信息方法一(union all + row_number()over ):insert overwrite table limao_store select p_key,sort_word from (原创 2013-11-04 15:03:32 · 2457 阅读 · 0 评论 -
hive函数参考手册
原文见:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF1.内置运算符1.1关系运算符运算符类型说明A = B所有原始类型如果A与B相等,返回TRUE,否则返回FALSEA == B无失败,因为无效的语法。 SQL使用”=”,不使用”==”。转载 2013-11-11 17:30:13 · 895 阅读 · 0 评论 -
sqoop使用
sqoop 是进出hadoop的重要工具。 用sqoop从RDBMS中导入数据sqoop import \ -D oozie.job.id=$wf_job_id \原创 2014-03-25 15:03:13 · 2147 阅读 · 0 评论 -
数据挖掘 决策树算法 ID3 通俗演绎
决策树是对数据进行分类,以此达到预测的目的。该决策树方法先根据训练集数据形成决策树,如果该树不能对所有对象给出正确的分类,那么选择一些例外加入到训练集数据中,重复该过程一直到形成正确的决策集。决策树代表着决策集的树形结构。决策树由决策结点、分支和叶子组成。决策树中最上面的结点为根结点,每个分支是一个新的决策结点,或者是树的叶子。每个决策结点代表一个问题或决策,通常对应于待分类对象的属性。每一个叶子结点代表一种可能的分类结果。沿决策树从上到下遍历的过程中,在每个结点都会遇到一个测试,对每个结点上问题的不同的原创 2014-06-06 18:01:52 · 1871 阅读 · 1 评论