自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(70)
  • 收藏
  • 关注

转载 鸡尾酒之伏特加

伏特加1. 血腥玛丽  Bloody Mary血腥玛丽血腥玛丽来源于一个传说中的鬼魂名字,因为这款鸡尾酒颜色深红像血液而得名。血腥玛丽被称作是喝不醉的番茄汁,这款酒最初在地下酒吧小范围流行,后来普及开后,成为了一款知名度非常高的鸡尾酒。色泽鲜红,口味又咸又甜,非常的独特。【诞生地】巴黎的哈里纽约酒吧【配料】50毫升伏特加,10毫升柠檬汁,鲜磨的胡椒粒,盐,2注Ta...

2019-09-20 22:57:00 612

转载 鸡尾酒之特基拉

特基拉(又名:龙舌兰 Tequila)1. 玛格丽特  Margarita玛格丽特玛格丽特被誉为是“鸡尾酒之后”,它是除了马天尼以外,世界上知名度最高的传统鸡尾酒。玛格丽特拥有二十多种的调制方法,现在市面上各种水果风味的玛格丽特居多,但传统玛格丽特为黄色。口感浓郁,带有清鲜的果香和龙舌兰酒的特殊香味,入口酸酸甜甜,非常的清爽。【诞生地】墨西哥【配...

2019-09-20 22:54:00 1852

转载 鸡尾酒之朗姆酒

朗姆酒1. 自由古巴自由古巴自由古巴是由朗姆加上可乐调制而成的,它具有口感轻柔的特点,非常适合在海滩酒吧饮用。2. 蓝色夏威夷蓝色夏威夷蓝色夏威夷是一款星座鸡尾酒,它所代表的星座是双鱼座。蓝色夏威夷与奇奇 Chi Chi、迈泰 Mai Tai、天蝎座 Scorpion三种鸡尾酒合称为夏威夷四大极品。3. 黛克瑞黛克瑞黛克瑞犹豫在调制过程...

2019-09-20 22:51:00 294

转载 鸡尾酒之金酒

金酒1. 马天尼  马天尼马天尼被认为是鸡尾酒中的最佳杰作,因此被誉为是“鸡尾酒之王”。虽然也有其他基酒调制的马天尼种类,但用金酒调制的马天尼是马天尼鸡尾酒最初的起源。2. 金菲士金菲士金菲士意为苏打水泡沫吱吱的响声,调制时因最后向杯中加入苏打水时,发出“吱吱”的声响而得名。金菲士口感非常的清凉爽口,因此也是夏季很畅销的一款鸡尾酒。3. 新加坡司令...

2019-09-20 22:49:00 187

转载 鸡尾酒之威士忌

威士忌1. 曼哈顿  Manhattan曼哈顿调制曼哈顿鸡尾酒时,威士忌最好选用美国威士忌或加拿大威士忌,这样鸡尾酒在香味和口感上会更醇厚。曼哈顿香气浓郁,甘甜可口,但其酒精度数也较高。著名英国首相丘吉尔之母发明,口感强烈而直接,因此也被称为“男人的鸡尾酒”自鸡尾酒诞生起,人们就一直喝着这款鸡尾酒,念念不忘它的味道,无论在哪一个酒吧,这款鸡尾酒总是客人的至爱,因...

2019-09-20 22:46:00 243

转载 鸡尾酒之白兰地

                    白兰地1. 亚历山大  Alexander    亚历山大亚历山大是最受女性欢迎的鸡尾酒之一,它的味道很甜美,常被用来象征爱情的甜蜜,非常适合情侣和夫妻共同饮用。口感香甜中略带辛辣,并且有浓郁的可可香味,特别适合女性朋友饮用【诞生地】英国【配方】白兰地1/3,可可甜酒1/3,鲜奶油1/3,豆蔻粉少量(可以不加)【调...

2019-09-20 22:43:00 202

转载 Hadoop面试总结(三)Hbase、Spark

HbaseHbase的角色:Hmaster和RegionServerHmaster:管理RegionServer:监控和处理故障转移Region的分配RegionServer:存储Hbase的真实数据处理Hmaster分配给他的RegionHbase的架构有两种:一种是作为存储的分布式文件系统、一种是作为数据处理的MR架构Hbase...

2019-07-26 10:45:00 99

转载 Hadoop面试总结(二)MySQL

Mysqlchar、varchar的区别是什么?(1)、varchar是变长而char的长度是固定的。如果你的内容是固定大小的,你会得到更好的性能。(2)、varchar(50)中50的涵义最多存放50个字符,varchar(50)和(200)存储hello所占空间一样,但后者在排序时会消耗更多内存,因为order by col采用fixed_length计算col长度(...

2019-07-25 16:49:00 75

转载 Hadoop面试总结(一)Linux命令、Scala

linux命令1:ls命令这是一个非常有用的查看文件与目录的命令,list之意,它的参数非常多,下面就列出一些我常用的参数吧,如下:-l :列出长数据串,包含文件的属性与权限数据等-a :列出全部的文件,连同隐藏文件(开头为.的文件)一起列出来(常用)-d :仅列出目录本身,而不是列出目录的文件数据-h :将文件容量以较易读的方式(GB,kB等)列出来-R :连同子目录的内容一起...

2019-07-25 10:02:00 155

转载 View

视图,虚拟表,从一个表或多个表中导出来的表,作用和真实表一样,包含一系列带有行和列的数据 视图中,用户可以使用SELECT语句查询数据,也可以使用INSERT,UPDATE,DELETE修改记录,视图可以使用户操作方便,并保障数据库系统安全优点简单化,数据所见即所得安全性,用户只能查询或修改他们所能见到得到的数据逻辑独立性,可以屏蔽真实表结构变化带来的影响缺点性能...

2019-07-23 16:08:00 82

转载 用户画像项目规划

1.1 项目名称 xxx 用户画像及其应用. 1.2 项目背景及概要在互联网逐步步入大数据时代后,不可避免的给企业和用户行为带来一系列 改变与重塑;其中最大的变化莫过于,用户的一切行为在企业面前是“可视化” 的.随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数 据来为精细化运营及精准营销服务,进而深入挖掘潜在的商业价值.于是,用户 画像的概念也就应运而生...

2019-07-03 16:02:00 734

转载 Apache kafka

Apache Kafka 最早是由Linkedln开源出来的分布式消息系统,现在是Apache旗下的一个子项目。 已经成为开源领域应用最广泛的消息系统之一 社区活跃 标语从“一个高吞吐量、分布式的消息系统” 改为 “一个分布式的流平台”什么是流(式数据处理)平台?具备三个特点 1:数据流注入 2:数据存储功能 3:流处理功能Kafka怎样实现这三种功能的?1:消息系统2:队...

2019-07-01 09:15:00 70

转载 Resume

下面我就给大家介绍一下十二个各个领域都包含的项目案列以下项目小编都有搭建与设计视频,有一定大数据基础与工作经验的朋友是可以根据视频内容完成整个项目的搭建的。非常的实用!需要视频的朋友,加入小编的java与大数据交流圈子615997810找群主获取视频学习这些项目的搭建。下面就来给大家介绍一下这十二个项目主要的内容与领域的权重值:1,离线数据处理:项目内容为通过对网站访问日志的...

2019-06-27 17:03:00 67

转载 Maven插件使用

Resources插件负责处理项目资源文件并拷贝到输出目录。Maven将main resources和test resources分开,一般main resources关联main source code,而test resources关联test source code。Resources插件目标有三个:resources:resources,拷贝main resource...

2019-06-19 15:18:00 132

转载 Spark终结

1 一、介绍Alluxio2 3 Tachyon正式改名为alluxio,并发布v1.0.0版本,alluxio是内存高速虚拟分布式存储系统。4 5 Alluxio是一个以内存为中心的虚拟分布式存储系统,统一数据访问和桥梁的计算框架和底层存储系统。应用程序只需要alluxio就可以把访问存储在任何底层存储系统的数据连接。此外,Alluxio以内存为中心的架构实现数据访...

2019-06-14 09:08:00 112

转载 Hive严格模式

前话:orderby 等。。hive 中的 order by 语句会对查询结果做一次全局排序,即,所有的 mapper 产生的结果都会交给一个 reducer 去处理,无论数据量大小,job 任务只会启动一个 reducer,如果数据量巨大,则会耗费大量的时间。注意:如果在严格模式下,order by 需要指定 limit 数据条数,不然数据量巨大的情况下会造成崩溃无输出...

2019-05-29 19:31:00 145

转载 集群的一些问题

 Web页面出现一些错误:namenode 出现 missing blocks的解决方案There are 2 missing blocks. The following files may be corrupted:blk_1078468526 /user/spark/sparkstreamingcheckpoint/checkpoint-1517487380000blk_...

2019-05-25 12:43:00 237

转载 spark连接hive数据库

hive在执行查询sql时出现java.lang.IllegalArgumentException: Wrong FS: hdfs://node1:9000/user/hive/warehouse/test1.db/t1, expected: hdfs://cluster1原因是hadoop由普通集群修改成了高可用集群后没有更改hive设置中warehouse在hdfs上的储存路径修...

2019-05-17 16:44:00 729

转载 RDD vs DataFrames vs DataSet

  在SparkSQL中Spark为我们提供了两个新的抽象,分别是DataFrame和DataSet。  他们和RDD有什么区别呢?首先从版本的产生上来看:  RDD (Spark1.0) —> Dataframe(Spark1.3) —> Dataset(Spark1.6)  如果同样的数据都给到这三个数据结构,他们分别计算之后,都会给出相同的结果。...

2019-05-15 20:20:00 119

转载 Spark-SQL

Spark SQL发家史熟悉spark sql的都知道,spark sql是从shark发展而来。Shark为了实现Hive兼容,在HQL方面重用了Hive中HQL的解析、逻辑执行计划翻译、执行计划优化等逻辑,可以近似认为仅将物理执行计划从MR作业替换成了Spark作业(辅以内存列式存储等各种和Hive关系不大的优化);同时还依赖Hive Metastore和Hive ...

2019-05-15 10:33:00 70

转载 量子行走

进展 | 强关联量子行走在12量子比特超导处理器上的实现  利用多个超导量子比特模拟各种量子效应是当前人们关注的前沿研究。近日,中国科学院物理研究所/北京凝聚态物理国家研究中心范桁研究员,北京计算科学研究中心/物理所张煜然博士等所组成的理论组与中国科学技术大学朱晓波教授、潘建伟教授及其团队闫智广、龚明等多位成员所组成的实验组,及浙江大学游建强教授、日本理化学研究所 No...

2019-05-13 11:51:00 914

转载 五月Spark

Resilient Distributed DatasetsRDD弹性1)自动进行内存和磁盘数据存储的切换2)基于血统的高容错机制3)Task、Stage 如果失败会自动进行特定次数的重试【默认次数是4次】5)Checkpoint和Persist(持久化) 可主动或被动触发RDD可以通过Persist持久化将RDD缓存到内存或者磁盘,当再次用到该RDD时直接读...

2019-05-13 10:35:00 53

转载 Spark算子(一)Transformat

常用的一些简单算子:map(func)返回一个新的RDD,该RDD由每一个输入元素经过func函数转换后组成flatMap(func)类似于map,但是每一个输入元素可以被映射为0或多个输出元素(所以func应该返回一个序列,而不是单一元素)partitionBy对RDD进行分区...

2019-05-10 10:16:00 95

转载 Spark键值对RDD的转化操作

1.1 键值对RDD的转化操作\\1.1.1 转化操作列表针对一个Pair RDD的转化操作 :、针对两个Pair RDD的转化操作 :转载于:https://www.cnblogs.com/Vowzhou/p/10833782.html...

2019-05-08 19:06:00 360

转载 Spark算子(二)Action

1.1.1 Actionreduce(func):通过function函数聚合RDD中的所有元素,        RDD必须是可交换且可并联的 1 scala> val rdd1 = sc.makeRDD(1 to 10,2) 2 rdd1: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[85]...

2019-05-08 11:52:00 68

转载 To be Happy & Wise Parents

2019-05-0810:30:33Ms Kim Barthel's lecture :Two voice, one brain.Gary Chen shared the most painful story about his 6 years old daughter. Currently, she is no oral language. And her Da...

2019-05-08 10:31:00 110

转载 Spark中利用Scala进行数据清洗(代码)

2019-05-07 18:56:18 1  package com.amoscloud.log.analyze 2 3 import java.text.SimpleDateFormat 4 import java.util.Date 5 6 import org.apache.spark.rdd.RDD 7 import org.apache.spar...

2019-05-07 18:55:00 2561

转载 Spark核心概念

Spark核心概念   每个Spark应用都由一个驱动器程序(driver program)来发起集群上的各种 并行操作。驱动器程序包含应用的 main 函数,并且定义了集群上的分布式数据集,还对这 些分布式数据集应用了相关操作。 
  驱动器程序通过一个 SparkContext 对象来访问 Spark。这个对象代表对计算集群的一个连 接。shell 启动时已经自动创建...

2019-05-06 20:07:00 60

转载 Scala面向对象详解

Scala的包(作用域)packagecom.jh.scala 等同于package jh \n package scala等同于packagecom.jh{ package scala {第一个包生明对当前整个文件内的包声明有效  1,源文件的目录和包之间并没有强制的关联关系包对象(弥补了JVM的不足)包可以包含 类,对象和 trait ,但不能包含函数或...

2019-04-18 20:18:00 102

转载 Scala控制语句

2019-04-1619:03:01ifelse表达式  var sumVal = 0  if ( sumVal == 0 ) {   println("true")  } else {   println("false")  }Scala中任意表达式都是有返回值的,也就意味着if else表达式其实是有返回结果的,具体返回结果的值取决...

2019-04-16 19:26:00 104

转载 Scala基础语法

2019-04-16 18:33:41标识符(变量名,方法名,类名)  用反引号`....`包括的任意字符串,即使是关键字也可以变量  val与var常用类型  Scala语言是完全面向对象的语言,所以并不区分基本类型和引用类型  7种数值类型:Byte、Char、Short、Int、Long、Float、Double  Java中基本类型的数...

2019-04-16 19:02:00 43

转载 Scala简介、安装、函数、面向对象

Scala是一门以java虚拟机(JVM)为目标运行环境并将面向对象和函数式编程的最佳特性结合在一起的静态类型编程语言。scala命令行窗口,我们称之为REPL,是指:Read->Evaluate->Print->Loop,也称之为交互式解释器。类似于MySQL的默认客户端工具在命令行窗口中输入scala指令代码时,解释器会读取指令代码并计算(Evaluatio...

2019-04-15 20:06:00 65

转载 Hbase优化

一:高可用1):关闭集群  stop-hbase.sh2):在conf目录下创建 backup-masters 文件  touch backup-masters3):backup-masters文件中配置高可用HMaster节点  echo k200 > backup-masters4):将整个conf目录scp到其他节点  scp -...

2019-04-09 14:53:00 65

转载 Hbase

在Hbase shell之外执行hbase命令echo "list" | hbase shell -nhbase shell fileNameForexample:插入数据:put 'test:test01' , '1001' , 'info:id' , 'taotao'https://www.ibm.com/developerworks/cn/ana...

2019-04-08 08:40:00 58

转载 Hadoop组件

---------Hive--------------------------zooKeeper-------------------------------kafka-----------------------------------sqoop-------------------------------flume-----------------------------------...

2019-03-29 14:48:00 88

转载 Vmworkstation启用错误

无法打开内核设备"\\.\Global\vmx86":系统找不到指定的文件. 是否在安装 VMwareWorksation 后重新引到 ? 问题解决无法连接MKS:套接字连接尝试次数太多正在放弃doc窗口输入:services.msc通过禁用,启用 重启这几个服务开启资源管理器中误关的VMware进程转载于:http...

2019-03-27 10:14:00 98

转载 sqoop

测试 Sqoop 是否能够成功连接数据库sqoop list-databases --connect jdbc:mysql//k200:3306/ --username root --password rootcreate database jinghang;create table student(id int(4) primary key not null auto_incr...

2019-03-22 13:44:00 74

转载 ZooKeeper02

Zookeeper 分布式服务框架是 Apache Hadoop 的一个子项目,主要是用来解决分布式应用中经常遇到的一些数据管理问题。转载于:https://www.cnblogs.com/Vowzhou/p/zooKeeper.html...

2019-03-15 20:00:00 57

转载 动物管理员--zooKeeper-01

ZooKeeper集群角色介绍:最典型集群模式:Master/Slave 模式(主备模式)。在这种模式中,通常 Master 服务器作为主服务器提供写服务,其他的 Slave 服务器从服务器通过异步复制的方式获取 Master 服务器最新的数据提供读服务。但是,在 ZooKeeper 中没有选择传统的 Master/Slave 概念,而是引入了Leader、Follower 和 ...

2019-03-15 13:08:00 123

转载 IP-v4&IP-v6

IPv6与IPv4区别:1:IPv6的地址空间更大。IPv4中规定IP地址长度为32,即有2^32-1个地址; 而IPv6中IP地址的长度为128,即有2^128-1个地址。2.IPv6的路由表更小。IPv6的地址分配一开始就遵循Aggregation(聚类)的原则,这使得路由器能在路由表中 用一条Entry(记录)表示一片子网,大大减小了路由器中路由表的长度,提交了路由...

2019-03-12 10:51:00 576

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除