自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

东杰书屋

多年大数据工作总结,个人的大数据导航https://bigdata.djbook.top/

  • 博客(10)
  • 资源 (12)
  • 收藏
  • 关注

原创 利用ruby通过thrift接口批量插入hbase

因为工作中使用fluentd采集日志,需要使用ruby通过thrift接口插入数据到hbase中,网上搜索了一下,发现很多都是插入单个数据,没办法只好参考python语言写的批量插入修改了代码,终于搞定。$:.unshift File.expand_path('gen-rb', File.dirname(__FILE__))require 'thrift'require File.

2013-01-31 18:05:58 2395

原创 利用zlib,lzo压缩与解压缩字符

zlib压缩解压缩代码require "zlib"include Zliblong_string = ("abcde"*71 + "defghi"*79 + "ghijkl"*113)*371puts long_string.size # 559097#压缩字符串s1 = Deflate.deflate(long_string,6)# Zlib::Deflate.defla

2013-01-29 10:42:17 4142

原创 ruby中in `split': invalid byte sequence in UTF-8 (ArgumentError)解决方法

#encoding=UTF-8require "socket"url="gid=38&sid=1&oldsid=1&user=12848525&roleid=1011730&dept=15&time=1356357372&level=40&ip=10.2.201.16&map_id=210010014&group=\xCE\xDE&sign=a04101ffd9f7fe07cba1b9f38"

2013-01-22 11:26:11 9239 2

翻译 ruby中数组的常用函数

在程序中定义一个数组在程序中定义一个数组,因为我们在下面说明。fruits = ["apple", "orange", "lemon"]scores = [55, 49, 100, 150, 0]如果你是指使用数组的数组#[]的方法,我们将指定数目的元素的数组作为参数。我单元号是从0开始。在上面的例子中,fruits[0]返回“apple”,scores[3]将返回150。

2013-01-22 11:01:26 14997 1

转载 解决ruby中文乱码

在文件头加上#encoding=UTF-8,示例:#encoding=UTF-8puts '你好,中国!'#在读取带有中文字符的文本文件时,要读取的文件必须以UTF-8编码保存。File.open('c:\\test.txt') do |file|  file.each_line{|line| puts line}end转载http://biyeah.iteye.c

2013-01-22 09:54:04 5641

转载 ruby 连接字符串

发现如果要把两个字符串连接在一起。如a = “abc”b = a + “de”此时b的值为”abcde”但如果a = nil时,就会抛出未定义“+”的异常,因为此时a为nil。但如果我们改变一下b右边的表达式,将其改为b = “#{a}de”。这时就不会抛出错误了,此时b=> “de”。向字符串末尾追加字符时, 使用 String#concat 或

2013-01-21 09:16:57 19723

转载 Linux 找出大文件汇总

Q. 如何在目录中找出所有大文件?A.1) 句法 for RedHat / CentOS / Fedora Linuxfind {/path/to/directory/} -type f -size +{size-in-kb}k -exec ls -lh {} \; | awk ‘{ print $9 “: ” $5 }’实例:查找当前目录下大于50MB的文件

2013-01-17 09:18:17 1527

原创 fluentd插件hbase修改笔记

工作中需要采集日志到hbase中,fluentd提供了插件fluentd-hbase,地址为https://github.com/Furyu/fluent-plugin-hbase不过插件只支持固定表插入数据,而工作中需求是根据日志中接口名动态创建表,对应接口插入数据,hbase中的timestamp需要使用20120522151215格式,需要对hbase插件进行二次开发,动态表创建插入数据

2013-01-09 16:49:23 2078

转载 字符串截取和查询操作

也许String对象最重要的操作就是通过[]下标访问操作了,你可以通过这种方式提取字符串内容或者更改字符串内容。在Ruby1.8中字符串被当作一个字节或者8位的字符码数组,你可以通过length或者size方法获得这个数组的长度,你通过在[]设置索引数字来设置或者得到那个位置的值:s = 'hello'; # Ruby 1.8s[0] # 返回值为104,第一个字母'

2013-01-09 13:27:27 15220

转载 基本的ruby语法

1.1      变量、常量和类型1)      定义变量变量类型描述示例局部变量(或伪变量)以小写字母或下划线卡头var    _var全局变量以$开头$var类变量类中定义,以@@开头@@var

2013-01-09 13:26:30 854

hbase 0.92 cloudera4.1.2修改包

修改thrift接口支持使用不同timestamp批量插入数据

2013-01-25

hbase 0.90 cloudera3u3修改包

修改hbase 0.90版本 cloudera3u3 中的thrift接口,mutation类中增加timestamp参数,可以通过thrift接口使用Hbase.Mutation(column="f1:1", value='test',timestamp=20130112121212),mutateRows("testdb1", batchmutations)方法批量插入不同时间戳的数据。

2013-01-25

fuse 2.8.5

利用这个工具可以实现挂载ntfs格式文件系统,本地硬盘挂载hadoop hdfs格式文件必须的软件包

2012-04-25

php连接hive thrift的lib依赖包

php连接hive thrift server的lib包,经测试用hive压缩包中自带的php lib无法测试成功

2011-07-01

nginx-fcgi.txt

Nginx 不能直接执行外部可执行程序,如果要让 Nginx 支持 CGI,可以考虑安装 nginx-fcgi: wget http://www.nginx.eu/nginx-fcgi/nginx-fcgi.txt mv nginx-fcgi.txt /usr/sbin/nginx-fcgi chmod +x /usr/sbin/nginx-fcgi 因为http://www.nginx.eu/nginx-fcgi/nginx-fcgi.txt无法下载 所以上传一个备份

2011-03-16

二进制定点整数补码运算中“丢失”与“溢出”问题的研究

二进制定点整数补码运算中“丢失”与“溢出”问题的研究论文

2009-09-25

haproxy for windows

HAProxy提供 高可用性 、负载均衡 以及基于TCP和HTTP应用的代理,它是免费、快速 并且可靠的一种解决方案

2009-08-21

js脚本压缩工具(.net版本)

网页中的js脚本文件比较大的时候可以用这个工具进行压缩,减少网页的浏览时间

2009-01-12

httpcfg.exe

使用两个IP实现IIS和Tomcat或Apache公用80端口的方法需要用到的工具软件

2008-12-09

文档对象模型中文手册

文档对象模型中文手册<br>chm格式

2007-12-14

打印页面插件

jatoolsPrinter 是一款实现网页套打的免费工具。该工具的特点是可以直接对web页面进行精确的分页打印,这不仅使"会设计网页就会做网页套打"成为可能,也使项目经理们摆脱了预算紧张的压力。jatoolsPrinter通过在网页中嵌入控件,解决了web客户端精确打印,批量打印,打印配置自动保留等问题

2007-11-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除