- 博客(8)
- 收藏
- 关注
原创 Hive 学习笔记
文章目录Hive第一章 Hive的基本概念1.1 什么是Hive1.2 Hive的由优缺点1.2.1 优点1.2.2 缺点第二章 Hive操作2.1 Hive 常用交互命令2.2 Hive其他命令操作第三章 Hive的数据类型3.1 基本数据类型3.2 集合数据类型查看某个字段的数据访问数组的内容Map的访问struct的访问3.3 Hive数据类型转换1. 隐式类型转换规则如下2. 可以使用ca...
2019-11-05 18:44:35 403
原创 Scala
文章目录Scala1 定义变量2 定义常量3 数据类型和操作符3.1 数据类型3.2 操作符4 表达式4.1 条件表达式4.2 块表达式5 循环5.1 for循环5.2 while循环5.3 do while循环6 方法6.1 带有参数列表的方法6.2 无参方法6.3 带有默认参数的方法6.4 可变长参数方法6.5 方法的嵌套和多态7 函数的定义7.1 无参函数7.2 方法和函数的区别何联系8 集...
2019-11-05 18:42:41 405
原创 Java 面向对象编程
Java 面向对象编程第一章 面向对象编程面向对象是Java最重要的特性。Java是彻底的、纯粹的面向对象语言,在java中一切都是对象1.1 面向对象简介面向对象的编程思想:按照真实世界客观事务的自然规律进行分析,客观世界中存在什么样的实体,构建的软件系统就存在什么样的实体。面向对象编程(object oriented programming,OOP),作为面向对象的计算机语言——...
2019-11-10 17:24:40 306 1
原创 Java 基础
Java基础与高级第一章 开发前言1.1 Java语言概述什么是Java语言: Java语言是美国Sun(Stranford Unniversity Newwork)公司,在1995年推出的高级编程语言1.2 计算机基础知识1.2.1 二进制二进制(binary)在数学和数字电路中指以2为基数的记数系统,以2为基数代表系统是二进位制的。这一系统中,通常用两个不同的符号0(代表零)和...
2019-11-08 16:06:28 265
原创 MapReduce 流量统计实战
数据源:1363157985066 13726230503 00-FD-07-A4-72-B8:CMCC 120.196.100.82 i02.c.aliimg.com 24 27 2481 24681 2001363157995052 13826544101 5C-0E-8B-C7-F1-E0:CMCC 120.197.40.4 4 0 264 0 200136315799107...
2019-11-07 08:57:51 384
原创 sqoop 数据工具的使用
sqoop数据工具文章目录sqoop数据工具第一章 sqoop简介第二章 Sqoop原理第三章 sqop的简单使用案例3.1 导入数据3.1.1 RDBMS到HDFS确定Mysql服务开启正常在Mysql中新键一张表并插入一些数据导入数据3.1.2 RDBMS 到Hive3.1.3 RDBMS 到HBase3.2 导出数据3.2.1 Hive 到RDBMS3.2.2 HDFS 到RDBMS--c...
2019-11-05 18:46:41 384
原创 Pandas 学习笔记
Pandas第一章 概述1.1 简单概述 Pandas 是一个python的包,提供快速、灵活和富有表现力的数据结构,旨在使“关系”或“标记”数据的使用既简单又直观。 Pandas 非常适合许多不同类型的数据:具有异构类型列的表格数据,如SQL表或Excel电子表格有序和无序(不一定是固定频率)时间序列数据具有行和列表前的任意矩形数据(均匀类型或异构)任何其他形式的观察/统计...
2019-10-30 15:24:27 292
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人