- 博客(12)
- 收藏
- 关注
转载 hive发杂数据结构的使用,struct,array,map
hive提供了复合数据类型:Structs: structs内部的数据可以通过DOT(.)来存取,例如,表中一列c的类型为STRUCT{a INT; b INT},我们可以通过c.a来访问域aMaps(K-V对):访问指定域可以通过["指定域名称"]进行,例如,一个Map M包含了一个group-》gid的kv对,gid的值可以通过M['group']来获取Arrays:array中的
2014-04-23 17:56:40 3175
原创 hive语句嵌入python脚本(进行map和reduce,实现左外连接)
add file ${python_script_path}/lanch_interval_count.py;drop table temp_lanch_interval2;create table temp_lanch_interval2 as select reportdate, appid,channelname, app_version, deviceid,ts,sameday
2014-04-23 17:54:35 5938
转载 hive基本的操作语句(实例简单易懂,create table XX as select XX)
创建表:hive> CREATE TABLE pokes (foo INT, bar STRING); Creates a table called pokes with two columns, the first being an integer and the other a string创建一个新表,结构与其他一样hive> create table new
2014-04-16 11:32:43 36219
转载 计算机编码方式详解(Unicode、UTF-8、UTF-16、ASCII)
整理这篇文章的动机是两个问题:问题一: 使用Windows记事本的“另存为”,可以在GBK、Unicode、Unicode big endian和UTF-8这几种编码方式间相互转换。同样是txt文件,Windows是怎样识别编码方式的呢?我很早前就发现Unicode、Unicode big endian和UTF-8编码的txt文件的开头会多出几个字节,分别是FF、FE(Unic
2014-04-11 14:37:22 1470
原创 saiku查询结果返回地址(saiku交互过程)
提交mdx语句,执行后, 查询结果的获得,访问这个地址:http://99.999.99.99:8080/saiku/rest/saiku/anonymousUser/query/4FF7D01E-8A6B-5EB4-991B-C0CE680A4BCA/result/flat这里,需要注意:4FF7D01E-8A6B-5EB4-991B-C0CE680A4BCA是交互的id,登陆sai
2014-04-09 18:05:23 1838
原创 saiku中文维度,补充说明
saiku在筛选中文维度 会出现浏览器白屏 停止响应的现象,经过跟踪源代码,分析原来在linux 操作系统中 数据库读取的中文和界面选取的编码是不一致的 解决方法, classes\saiku-datasources 里你的对应的数据库连接配置文件里加上?useUnicode=true&characterEncoding=utf8最终成为location=jdbc:mondrian
2014-04-08 14:38:53 2968 2
原创 项目报错查询记录
saiku数据查询结果错误,是hive中源数据的3倍。问题定位: saiku执行的mdx有问题SELECT NON EMPTY {[Measures].[Downloads]} ON COLUMNS,NON EMPTY FILTER(CrossJoin(CrossJoin([appname.default].[appname].Members, CrossJoin([dev
2014-04-04 18:17:56 1363
原创 saiku中文查询(鉴于有人提问:saiku执行mdx,有中文报错)
有人问我saiku的中文查询问题:saiku默认执行英文,很多人,在mysql里录入了中文,使用sql语言查询没有问题。可是,用saiku的mdx查询,就会报错。这是因为mysql默认支持中文查询。而saiku不行,尤其是utf-8编码格式。一般gbk编码可能还可以。 所以出现:mdx执行报错。而把mdx转换成的sql语言,却能在mysql里查出结果。 解决:saiku
2014-04-02 11:01:36 2622
转载 kettle简介(整体架构,运行方式,使用方法)
项目负责人Matt的说法:把各种数据放到一个壶里,然后呢,以一种你希望的格式流出。呵呵,外国人都很有联想力。看了提供的文档,然后对发布程序的简单试用后,可以很清楚得看到Kettle的四大块:Chef——工作(job)设计工具 (GUI方式)Kitchen——工作(job)执行器 (命令行方式)Spoon——转换(transform)设计工具(GUI方式)pan——转换(tr
2014-04-01 11:30:54 10340
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人