自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 hive常用函数

hive函数hive中函数有如下类型: - 数学函数 - 字符函数 - 收集函数 - *转换函数 - 日期函数 - 条件函数 - 聚合函数 - 表生成函数数学函数(1)round:四舍五入 select round(数值,小数点位数);(2)ceil:向上取整 select ceil(45.6); --46(3)floor:向...

2018-07-19 09:57:15 611

原创 开发环境、测试环境、生产环境、UAT环境、仿真环境论述

开发环境、测试环境、生产环境、UAT环境、仿真环境论述三个环境也可以说是系统开发的三个阶段:开发->测试->上线,其中生产环境也就是通常说的真实环境:开发环境(DEV)测试环境(UAT)生产环境(PROD)开发环境(DEV)开发环境是程序猿们专门用于开发的服务器,配置可以比较随意, 为了开发调试方便,一般打开全部错误报告。测试环境(UAT)一...

2018-07-16 18:22:45 1436

原创 Kafka客户端开发

Kafka客户端开发pom依赖 这里写链接内容dependency> groupId>org.apache.kafkagroupId> artifactId>kafka_2.11artifactId> version>0.10.2.0version>dependency>dependency> groupId>org.apache.kafkagr

2018-02-03 20:01:38 335

原创 数据处理七之匹配ip查找地区

数据样例(数据量太大无法提供全部) ip.txt 1.2.4.0|1.2.4.255|16909312|16909567|亚洲|中国|北京|北京||中国互联网信息中心|110100|China|CN|116.405285|39.904989 1.2.5.0|1.2.7.255|16909568|16910335|亚洲|中国|福建|福州||电信|350100|China|CN|119.3062

2018-01-27 21:51:07 690

原创 数据处理六之全局分组TOPN

数据 http://bigdata.edu360.cn/laozhang http://bigdata.edu360.cn/laozhang http://bigdata.edu360.cn/laozhao http://bigdata.edu360.cn/laozhao http://bigdata.edu360.cn/laozhao http://bigdata.edu360.cn

2018-01-27 21:40:06 452

原创 数据处理五之去重

数据 file1:2012-3-1 a 2012-3-2 b 2012-3-3 c 2012-3-4 d 2012-3-5 a 2012-3-6 b 2012-3-7 c 2012-3-3 cfile2:2012-3-1 b 2012-3-2 a 2012-3-3 b 2012-3-4 d 2012-3-5 a 2012-3-6 c 2012-3-7 d

2018-01-27 21:30:17 503

原创 数据处理四之平均温度

数据生成逻辑import java.io.{File, FileWriter}import org.apache.spark.util.randomimport scala.util.Randomobject DealDataExample4_1 { val random = new Random() val arr = Array("北京","上海","广州","

2018-01-27 21:25:03 1012

原创 数据处理三之 用户在线时长和登录次数统计

数据 2016-04-18 16:00:00 {“areacode”:”浙江省丽水市”,”countAll”:0,”countCorrect”:0,”datatime”:”4134362”,”logid”:”201604181600001184409476”,”requestinfo”:”{\”sign\”:\”4\”,\”timestamp\”:\”1460966390499\”,\”rema

2018-01-27 21:19:47 2447

原创 数据处理案例二之数据汇总

数据 1010,华语剧场|剧情|当代|类型,1,0 1010,剧情|剧情|家庭剧|类型|热血,1,1 1011,华语剧场|剧情|当代|类型,1,0 1011,剧情|爱情|家庭剧|类型|热血,1,1 1012,华语剧场|剧情|当代|类型,1,0 1012,剧情|爱情|剧情|剧情|家庭剧|类型|热血,1,1 1011,华语剧场|剧情|当代|类型,1,0 1012,剧情|爱情|剧情|剧情

2018-01-27 20:57:14 705

原创 数据处理案例一之"求同存异"

数据 a.txt: u1 12 zs u2 15 xx u3 18 aaa u4 20 xa1 u5 22 xa2b.txt u1 2016 9 m1 u2 2017 12 m2 u3 2017 1 m3 u3 2014 2 m4 u3 2012 3 m5 2. 需求 两个数据集: 数据集A id,age,name 数据集B id

2018-01-27 20:51:54 1895

原创 spark要点-01

一. Spark四种运行模式1.local 模式 spark-shelllocal模式没有指定master地址,仅在本机启动一个进程(SparkSubmit),没有与集群建立联系。但是也可以正常启动spark shell和执行spark shell中的程序2.standalone模式 Spark Shell中已经默认将SparkContext类初始化为对象sc。用户代码如果需要用到

2018-01-22 20:12:37 336

原创 点击量与浏览量的数据处理

数据处理源数据样例 1010,华语剧场|剧情|当代|类型,1,0需求 1010,华语剧场|剧情|当代|类型,1,0 数据格式说明: id,关键字组合,使用的是|分割符,是否展示(0未展示,1展示),点击(0未点击,1点击))要求输出:1010 关键字 展示量 点击量 输出示例:1010 华语剧场 3 2代码实现import scala.collection.

2018-01-20 13:38:55 1776

原创 sparkRPC通信框架模拟

业务需求 1,master worker 都要启动 2,worker在启动之后,需要向master发送注册请求 附带信息 workerId, cores 内存 可以使用 case calss 封装数据 3,master接收到worker的请求信息之后,保存worker的注册信息,向worker发送响应信息(注册成功) 4,worker收到注册成功的信息之后,要定时发送心

2018-01-19 22:11:57 295

原创 多台客户端访问服务端简单实现

多台客户端访问服务端简单实现Serviceimport akka.actor.{Actor, ActorSystem, Props}import com.typesafe.config.ConfigFactoryclass Service extends Actor { override def receive: Receive = { case "start" => {

2018-01-17 21:44:21 455

原创 scala面向对象

1.数组反转object ExcuDemo { def swapArray(arr:Array[Int]) ={ //这里只能使用until for (i 0 until arr.length-1 if(i%2==0)){ arr(i) = arr(i)^arr(i+1) arr(i+1) = arr(i)^arr(i+1) arr

2018-01-17 00:30:55 436

原创 scala进阶

1.集合 Scala的集合有三大类:序列Seq、集Set、映射Map,所有的集合都扩展自Iterable特质 在Scala中集合有可变(mutable)和不可变(immutable)两种类型(两个不同的包), 包的全局路径:scala.collection.immutable默认使用的是该包中的集合如果想使用可变的集合,就需要导包scala.collection.mutableimmutabl

2018-01-16 08:57:20 482

原创 scala基础

**Scala概述** 1.什么是Scala 编程语言,java shell javascript 函数式编程: 函数式编程是一种编程思想,主要的思想把运算过程尽量写成一系列的函数调用。 Scala是一种多范式的编程语言,其设计的初衷是要集成面向对象编程和函数式编程的各种特性。 Scala运行于Java平台(Java虚拟机),并兼容现有的Java程序。 scala是对ja

2018-01-14 00:03:41 248

原创 面试题

id course 1,a 1,b 1,c 1,e 2,a 2,c 2,d 2,f 3,a 3,b 3,c 3,ecreate table student_course( num int, course string) row format delimited fields terminated by ‘,’;select num as 学号,course

2018-01-13 08:20:13 239

原创 海量数据处理

需求分析1、数据预处理 –》 release_channel,device_id,city,device_id_type,app_ver_name 这几个字段如果缺失,则过滤 –》 将数据整成 字段,字段,字段,…… 这种形式 –》 在每条数据中添加一个字段:user_id(值就是device_id)2、导入hive中的表的天分区 3、进行数据统计分析 每天

2018-01-11 00:12:09 359

原创 查询累计销售额案例(级联查询)

查询累计销售额案例(级联查询)店铺 月份 总销售额 累计到当月的总销售额 a 01 350 350 a 02 5000 5350 a 03 600 5950 …….

2018-01-08 14:07:39 647

原创 LinkedList 去除集合中自定义对象的重复值(对象的成员变量值都相同)

package cn.edu360;import java.util.ArrayList;import java.util.Iterator;import java.util.LinkedList;public class Test1 {public static void main(String[] args) {// TODO Auto-gene

2017-11-13 08:24:02 1745

原创 购物平台的搭建。

购物平台得搭建!import java.util.Scanner;public class ShopMenu{public static void main(String[] args){ProductManagement pMgmt=new ProductManagement();//利用商品工具为商品添加数据CreateSomeProducts.creat(pM

2017-11-06 14:26:38 442

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除