自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

duncan

目标不会嫌来的太晚,坚持就一定会成功。

  • 博客(20)
  • 资源 (1)
  • 收藏
  • 关注

RStudio Server安装说明

rstudio-server安装步骤: 一、安装R1、安装R的core核心包:到R官网下载安装包并通过如下命令安装rpm -ivh R-core-3.2.0-2.el6.x86_64.rpm 2、检测是否安装成功:R  查看是否正确进入R,然后在交互式控制台输入1 + 1,查看是否正确运算即可。  [running]slave1@192.168.13.1...

2015-11-25 10:27:18 627

RStudio Server安装说明

2015-11-25 10:27:18 205

spark sql基本使用方法介绍

spark中可以通过spark sql 直接查询hive或impala中的数据, 一、启动方法/data/spark-1.4.0-bin-cdh4/bin/spark-sql --master spark://master:7077 --total-executor-cores 10  --executor-memory 1g --executor-cores  2 注:/...

2015-11-23 19:22:43 624

spark sql基本使用方法介绍

ecutor-memory 1g --executor-cores  2 注:/data/spark-1.4.0-bin-cdh4/为spark的安装路径 /data/spark-1.4.0-bin-cdh4/bin/spark-sql –help 查看启动选项 --master MASTER_URL           指定master url--executor-memory MEM          每个executor的内存,默认为1G--total-executor

2015-11-23 19:22:43 171

impala数据插入的方法详解

impala是一种内存计算的数据库,查询性能相比于hive官网称是快100倍,其向表中插入数据的方法如下: 1、insert into[slave12:21000] > insert into parquet_snappy select * from raw_text_data;Inserted 1000000000 rows in 181.98s 2、CTAS...

2015-11-19 10:38:47 7916

impala数据插入的方法详解

_snappy select * from raw_text_data;Inserted 1000000000 rows in 181.98s 2、CTAS [slave12:21000] > create table test_table  STORED AS PARQUET as select * from table;Query: create table test_table  STORED AS PARQUET as select * from table+---

2015-11-19 10:38:47 1051

hive 查看一个表的总文件大小方法

要查看一个hive表文件总大小时,我们可以通过一行脚本快速实现,其命令如下: $ hadoop fs -ls  /user/hive/warehouse/test_table/ds=20151111|awk -F ' ' '{print $5}'|awk '{a+=$1}END{print a}'32347122009 这样可以省去自己相加,下面命令是列出该表的详细文件列表...

2015-11-12 18:02:17 3785

hive 查看一个表的总文件大小方法

awk '{a+=$1}END{print a}'32347122009 这样可以省去自己相加,下面命令是列出该表的详细文件列表hadoop fs -ls  /user/hive/warehouse/test_table/ds=20151111 方法二:查看该表总容量大小,单位为G hadoop fs -du /user/hive/warehouse/test_table|awk ' { SUM += $1 } END { print SUM/(1024*1024*1024) }

2015-11-12 18:02:17 1679

mysql碎片整理方法

  对于一个表如果经常插入数据和删除数据,则会产生很多不连续的碎片,这样久而久之,这个表就会占用很大空间,但实际上表里面的记录数却很少,这样不但会浪费空间,并且查询速度也更慢,因此为了解决这个问题,可以有以下解决方案 1、myisam存储引擎清理碎片方法  OPTIMIZE TABLE table_name  2、innodb存储引擎清理碎片方法 ALTER T...

2015-11-10 11:55:44 650

mysql碎片整理方法

少,这样不但会浪费空间,并且查询速度也更慢,因此为了解决这个问题,可以有以下解决方案 1、myisam存储引擎清理碎片方法  OPTIMIZE TABLE table_name  2、innodb存储引擎清理碎片方法 ALTER TABLE tablename ENGINE=InnoDB  3、查看表碎片的方法 mysql> select ROW_FORMAT,TABLE_ROWS,DATA_LENGTH,INDEX_LENGTH,MAX_D

2015-11-10 11:55:44 340

原创 shell中let和expr用法及性能比较

1、expr计算整数变量值格式 :expr arg例子:计算(2+3)×4的值1、分步计算,即先计算2+3,再对其和乘4s=`expr 2 + 3`expr $s \* 42、一步完成计算:expr  `expr 2 + 3 `  \* 4–说明:运算符号和参数之间要有空格分开;通配符号(*),在作为乘法运算符时要用\、“”、‘’符号修饰–:expr 3 \...

2015-11-10 11:25:56 985

原创 shell中let和expr用法及性能比较

r  `expr 2 + 3 `  \* 4–说明:运算符号和参数之间要有空格分开;通配符号(*),在作为乘法运算符时要用\、“”、‘’符号修饰–:expr 3 \* 2         expr 3 “*” 2       expr 3 ‘*’ 2  `(反引号)与键盘上的~同一个键上的符号  [fsy@localhost ~]$ s=`expr 2 + 3`[fsy@localhost ~]$ echo $s5[fsy@localhost ~]$ expr $s \* 42

2015-11-10 11:25:56 791

shell dirname的使用

1、用途说明dirname命令可以取给定路径的目录部分,如果给定的参数本身为一个目录,那就取当前目前的上一层目录。这个命令很少直接在shell命令行中使用,一般把它用在shell脚本中,用于取得脚本文件所在目录,然后将当前目录切换过去。 Usage: dirname NAME  or:  dirname OPTIONPrint NAME with its trailing /...

2015-11-09 19:11:40 1522

shell dirname的使用

2015-11-09 19:11:40 396

hive 行转列和列转行的方法

一、行转列的使用1、问题hive如何将a       b       1a       b       2a       b       3c       d       4c       d       5c       d       6变为:a       b       1,2,3c       d       4,5,6 2、数据test.txta...

2015-11-06 19:56:05 1507

hive 行转列和列转行的方法

5c       d       6变为:a       b       1,2,3c       d       4,5,6 2、数据test.txta       b       1 a       b       2 a       b       3 c       d       4 c       d       5 c       d       6 3、答案1.建表drop table tmp_jiangzl_test;create table tm

2015-11-06 19:56:05 340

原创 hive array、map、struct使用

hive提供了复合数据类型:Structs: structs内部的数据可以通过DOT(.)来存取,例如,表中一列c的类型为STRUCT{a INT; b INT},我们可以通过c.a来访问域aMaps(K-V对):访问指定域可以通过["指定域名称"]进行,例如,一个Map M包含了一个group-》gid的kv对,gid的值可以通过M['group']来获取Arrays:array中的数据为相同...

2015-11-06 19:40:35 60

原创 hive array、map、struct使用

K-V对):访问指定域可以通过["指定域名称"]进行,例如,一个Map M包含了一个group-》gid的kv对,gid的值可以通过M['group']来获取Arrays:array中的数据为相同类型,例如,假如array A中元素['a','b','c'],则A[1]的值为'b'Struct使用建表:[plain] view plaincopy hive> create table student_test(id INT, info s

2015-11-06 19:40:35 95

hive with查询用法及CTAS的使用

hive 可以通过with查询来提高查询性能,因为先通过with语法将数据查询到内存,然后后面其它查询可以直接使用 with q1 as ( select key from src where key = '5')select *from q1; -- from stylewith q1 as (select * from s...

2015-11-04 17:48:02 1849

hive with查询用法及CTAS的使用

m src where key = '5')select *from q1; -- from stylewith q1 as (select * from src where key= '5')from q1select *; -- chaining CTEswith q1 as ( select key from q2 where key = '5'),q2 as ( select key from src where key = '

2015-11-04 17:48:02 463

apache-tomcat-5.5.27.exe

这是apache-tomcat-5.5.27,可以用其进行作为JSP的服务器

2008-10-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除