糯米多排骨
码龄17年
关注
提问 私信
  • 博客:7,380
    7,380
    总访问量
  • 4
    原创
  • 1,892,085
    排名
  • 1
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:四川省
  • 加入CSDN时间: 2007-08-27
博客简介:

糯米多排骨的专栏

查看详细资料
个人成就
  • 获得0次点赞
  • 内容获得1次评论
  • 获得2次收藏
创作历程
  • 5篇
    2013年
  • 1篇
    2012年
TA的专栏
  • java
    1篇
  • 编码
    1篇
  • web
    1篇
  • hadoop
    3篇
  • kafka
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

zookeeper汇总

Zookeeper 会维护一个具有层次关系的数据结构,它非常类似于一个标准的文件系统每个节点叫做znode ,znode可以有子节点目录,并且每个 znode 可以存储数据,注意 EPHEMERAL 类型的目录节点不能有子节点目录znode 是有版本的,每个 znode 中存储的数据可以有多个版本,也就是一个访问路径中可以存储多份数据
原创
发布博客 2013.08.22 ·
704 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

hive join优化

整理两年前草稿MapJoin在使用合理的情况下性能优于普通Join,可以通过显式的优化器提示让执行计划采用mapjoin,这在大部分hive的优化文章中都有介绍,这里想说的是可以通过配置hive的参数,在join中存在小表时优化器自动采用mapjoin完成连接操作,设置参数如下:hive.auto.convert.join = truehive.smalltable.filesize
原创
发布博客 2013.08.07 ·
1355 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

hive索引浅析

整理两年前草稿hive索引通过减少过滤操作所需要的列数,增加查询效率。hive的索引其实是一张表,表的记录结构为:col1,col2...-key,其中key对应file-name+offset(row或block的firstrow),注意区别B树索引,hive的索引不需要排序,不支持rangeScan,支持索引键满足的聚集。索引条件:只支持单表索引,不支持多表链接索引
原创
发布博客 2013.08.07 ·
1359 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

hive权限设置 部分翻译

整理2年前的草稿目前版本中的hive权限管理主要是防止用户的误操作,并不能防止用户的非法访问与恶意破坏。修改配置文件如下: hive.security.authorization.enabled true enable or disable the hive client authorization hive.security.authorizati
翻译
发布博客 2013.08.07 ·
1058 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

搭建hive调试环境

整理两年前的草稿通过以下步骤在IDE上搭建Hive的编译、调试环境,从而深入学习hive: 这里使用NetBeans编译并调试Hive(0.7.1) 1. 新建Java应用程序项目 2. 导入需要调试的源包 3. 在库中添加hive目录lib下的所有jar、Hadoop项目依赖(无hadoop调试需求的也可以直接导入hadoop的core)、mysql库(如果跟我一样,
原创
发布博客 2013.08.07 ·
1006 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

R语言 分类算法 代码

发布资源 2012.07.16 ·
R

URLEncode、decode 神贴

网页中的表单使用POST方法提交时,数据内容的类型是 application/x-www-form-urlencoded,这种类型会:  1.字符"a"-"z","A"-"Z","0"-"9",".","-","*",和"_" 都不会被编码;  2.将空格转换为加号 (+) ;  3.将非文本内容转换成"%xy"的形式,xy是两位16进制的数值;
转载
发布博客 2012.07.12 ·
1877 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏