![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
spark
wzw12315
这个作者很懒,什么都没留下…
展开
-
Hive 基本操作
Hive基本操作与案例 1. 创建数据库,切换数据库 create database testdb2; use testdb2; 2. 创建管理表 create table emp( empno int, empname string, job string, mgr int, hiredate string, salary double, comm d转载 2017-10-27 14:50:48 · 291 阅读 · 0 评论 -
flume 性能优化
flume的整体基础架构包括三个,分别是source,chanel, sink. 下面是官网的截图: 因此,优化要从三个组件的角度去分别优化。 1、source sources是flume日志采集的起点,监控日志文件系统目录。其中最常用的是 Spooling Directory Source , Exec Source 和 Avro Source 。 关键参转载 2017-10-19 16:46:18 · 396 阅读 · 0 评论 -
spark word count
package com.nassoft.spark; import java.io.IOException; import java.util.Arrays; import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaPairRDD; import org.apache.spark.api.java.Java原创 2017-10-11 15:47:05 · 184 阅读 · 0 评论