自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 资源 (53)
  • 收藏
  • 关注

原创 从hbase加载数据到hdfs

  package example2; import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoo...

2015-01-16 17:02:18 199

原创 从hadoop取出文件写入hbase表中

  package example2;import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.HBaseConfiguration;import org.apache.hadoop.hbase.KeyValue;i...

2015-01-16 17:01:11 246

原创 hdfs Map\Reduce到haase

 1. 上传数据到hdfs中2. 写Map\Reduce过程3. 输出结果到hbase中Tips:1. 因为map是从hdfs中取数据,因此没有太大变化;而reduce需要输出结果到hbase中,所以这里继承了 TableReduce<keyin,valuein,keyout>,这里没有valueout,但是规定TableReduce的 valueout必须是Pu...

2015-01-16 16:53:41 80

原创 Hbase通过 Mapreduce 写入数据到Mysql

  <dependencies> <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-common</artifactId> <...

2015-01-16 10:10:53 245

原创 canal使用配置详解

  a.  canal的原理是基于mysql binlog技术,所以这里一定需要开启mysql的binlog写入功能,并且配置binlog模式为row.  [mysqld] log-bin=mysql-bin #添加这一行就ok binlog-format=ROW #选择row模式 server_id=1 #配置mysql replaction需要定义...

2015-01-15 10:42:23 4216

原创 Linux系统上安装MySQL 5.5prm,rpm依赖性检测失败解决

 从MySQL官网上分别下载mysql服务器端于客户端包。 如: MySQL-server-5.5.15-1.linux2.6.x86_64.rpm和MySQL-client-5.5.15-1.linux2.6.x86_64.rpm 并放到/opt目录下2.检测系统是否安装MySQL (1)进入系统后,检测是否安装mysql. 如:检测是否安装M...

2015-01-14 19:03:35 1409

原创 ubuntu apt-get 卸载mysql,重启,MYSQL 安装及配置

  一、卸载删除 mysql 1 sudo apt-get autoremove --purge mysql-server-5.02 sudo apt-get remove mysql-server3 sudo apt-get autoremove mysql-server4 sudo apt-get remove mysql-common (非常重要) 上面的其实有一些是多余的,建议还...

2015-01-14 09:31:32 430

原创 shell判断hdfs文件目录是否存在

 hadoop有提供相应的脚本去验证文件目录是否存在的: -bash-3.2$ hadoop fs -help ... -test -[defsz] <path>: Answer various questions about <path>, with result via exit status. -d retu...

2015-01-08 14:33:53 846

原创 shell中执行hive语句

  1.执行select查询$HIVE_HOME/bin/hive -e 'select a.col from tab1 a'$HIVE_HOME/bin/hive -e "use mydb;select a.col from tab1 a where a.dt='2015-01-07';" 2.加入配置变量的查询$HIVE_HOME/bin/hive -e 'se...

2015-01-08 14:13:46 998

原创 超越算法来看待个性化推荐

        一提到个性化推荐,大家一般会想到协同过滤、文本相似等推荐算法,或是更高阶的模型推荐算法,百度的张栋说过,推荐40%取决于UI、30%取决于数据、20%取决于背景知识,虽然本人不是很认同这种比例,但推荐系统中,推荐算法起的作用起的作用是非常有限的。      就像任何数据挖掘应用一样,算法不是起决定作用的,背景知识、数据很重要。通过算法或数学模型来描述和解决问题,我觉得是工...

2015-01-08 11:21:50 173

原创 hive分区操作

  必须在表定义时创建partition a、单分区建表语句:create table day_table (id int, content string) partitioned by (dt string);单分区表,按天分区,在表结构中存在id,content,dt三列。 以dt为文件夹区分 b、 双分区建表语句:create table day_hour...

2015-01-08 11:17:42 93

原创 storm java.io.IOException: No such file or directory

 storm 报错出现如下错误: java.io.IOException: No such file or directory at java.io.UnixFileSystem.createFileExclusively(Native Method) at java.io.File.createNewFile(File.java:883) at com.future.util.r...

2015-01-07 13:39:18 1060

原创 hadoop 目录给某个用户授权

  首先在hdfs上创建/flume目录:hadoop fs -mkdir /flume 给该目录授权给flume用户和组:hadoop fs -chown -R flume:flume /flume

2015-01-07 13:39:05 2749

原创 FlumeNG与Kafka整合

   1,作为Producer的Flume端配置,其中是以netcat为source数据源,sink是kafka  #agent section producer.sources = s producer.channels = c producer.sinks = r #source section #producer.sources.s...

2015-01-06 17:45:30 173

原创 Flume监听文件目录sink至hdfs按照每天切割

  采用的channels为file,sink为hdfs,此处往hdfs写的策略是当时间达到3600s或者文件大小达到128M。可以自己调整 agent1.sources = source1agent1.sinks = sink1agent1.channels = channel1# Describe/configure spooldir source1#a...

2015-01-06 17:24:10 905

原创 windows 2003 32位系统 能支持的最大内存数

     打开 Boot.ini 文件,然后将 /PAE 参数添加到 boot.ini中,如以下所示: multi(0)disk(0)rdisk(0)partition(2)\%systemroot%="Windows Server 2003, Datacenter Edition" /PAE 如果CPU、主板、操作系统都支持并启用PAE(物理地址扩展),那么此时的物理内存地...

2015-01-06 16:02:46 466

原创 Hive读取Flume正在写入的HDFS

 Hive的表创建为外部分区表,例如: USE mydb;CREATE EXTERNAL TABLE mytable(   c1 String,  c2 INT,  c3 INT,  create_time String)PARTITIONED BY (dt STRING)ROW FORMAT DELIMITED FIELDS TERMINATE...

2015-01-06 15:48:35 150

原创 flume-ng avro方式传输数据配置 flume-ng多节点实例

 tail-to-avroagent1.sources = source1agent1.sinks = sink1agent1.channels = channel1# Describe/configure spooldir source1#agent1.sources.source1.type = spooldir#agent1.sources.source1...

2015-01-06 10:49:23 314

Ketama Hashing Algorithm

Ketama Hashing Algorithm java代码完全可以运行,已经添加了Node类,和一些注释。

2014-02-27

通用java分页后端服务代码

通用java分页后端服务代码,前段请自行实现。

2014-02-07

Highcharts line Demo

Highcharts line Demo

2013-12-08

Highcharts json

Highcharts实现的json提供数据的波浪线的实例

2013-12-05

Scribe日志记录讲解

thrift框架的分布式日志记录框架,支持多种语言实现。

2013-12-05

HighchartsDemo

Highchart非常好用的图标展示,纯js展示。可自行修改为支持json

2013-12-05

easyUI使用Demo

easyUI使用Demo,easyUI数据展示报表利器

2013-12-05

zookeeper dotnet客户端源码

zookeeper的dotnet客户端源码实现,ClientTests类为调用例子。

2013-10-15

Hadoop权威指南(第2版)

Hadoop权威指南(第2版)学习Hadoop MapReduce重要资料

2013-09-27

Hadoop in Action英文版

Hadoop in Action英文版,学习Hadoop MapReduce重要资料

2013-09-27

C#定时执行

C#定时执行,springQuartz定时器定时执行程序。执行时间可配置每秒,天,周,年执行一次

2013-09-18

debugbar-v7.0.zip

debugbar-v7.0 带注册机 win7下可以使用

2013-08-26

ThriftC#代码实现

ThriftC#代码实现,详细代码实现,文档见http://download.csdn.net/detail/liyonghui123/5770001

2013-07-17

查看java源码工具

查看java源码工具,查看打包好的jar中的java源码

2013-07-17

ThriftC#实现

ThriftC#实现,实现通过Thrift实现客户端和服务端调用,可以跨语言调用的例子

2013-07-17

zookeeper-3.4.5

zookeeper-3.4.5,分布式服务系统管理

2013-07-12

windows环境下thrift.exe的使用

windows环境下thrift.exe开发thrift

2013-07-12

webspring-mvc

上次写的那个引用乱了。 spring mvc+ibatis,webspring-mvc源码实例,实现了注解,拦截器,ibatis等实例

2013-06-17

Spring 注解学习手札

Spring 注解学习手札,个人学习Spring mvc的知识总结

2013-06-15

host快速切换工具

host快速切换工具,方便的切换host

2013-06-15

Maven下建立的spring+struts2+jstl实例

Maven下建立的spring+struts2+jstl实例

2013-06-15

webspring-mvc.rar

webspring-mvc源码实例,实现了注解,拦截器等实例

2013-06-15

spring_3.0_应用springmvc_构造RESTful_URL_详细讲解

pring_3.0_应用springmvc_构造RESTful_URL_详细讲解

2013-06-13

Spring3.0-mvc

Spring3.0-mvc初学者资料,Spring mvc简单示例

2013-06-08

C#多线程执行

C#,编写的多线程执行处理程序,同时执行多个任务,共大家参考。

2013-02-01

ConsistentHash(Ketama)

C#一致性hash算法,性能绝对最优。结算结果和Java版本结果完全相同。

2012-12-11

多线程安全dictionary

多线程下能够安全访问的Collections,dictionary

2012-11-23

jQueryAPI-100204 学习jQuery

jQueryAPI-100204 学习jQuery的基本知识,这里基本覆盖啦,有了它不用愁了。

2011-04-02

C#设计模式 设计模式 架构设计

设计模式 架构设计 更好的学好设计模式的书,可以帮助你很快的了解架构设计

2011-04-02

GOF_设计模式 设计模式 架构设计

设计模式 架构设计 更好的学好设计模式的书,可以帮助你很快的了解架构设计

2011-04-02

Ibatistest

Ibatis 实例 一个简单的学习Ibatis的例子

2010-07-28

server-u6.0完全破解

server-u6.0完全破解,完全解决试用30天的问题。

2010-04-25

SQL2005安装图解

SQL2005安装图解 安装cd2时报错,没有要升级的组件的原因及解决方法。

2010-04-25

zookeeper分布式锁

zookeeper分布式锁代码实现 适合大型集群

2014-12-21

Flume+Kafka+Storm分布式环境整合Eclipse工程

Flume+Kafka+Storm分布式环境整合Eclipse工程

2014-07-22

_Flume+Kafka+Storm分布式环境整合Eclipse工程

_Flume+Kafka+Storm分布式环境整合Eclipse工程

2014-07-22

thrift在windows下生成C#代码

thrift在windows下生成C#代码

2014-05-07

简单C#新闻发布系统

简单C#新闻发布系统,实现了静态页生成功能,只能简单操作,么有复杂实现。适合初学者,谢谢

2014-04-02

pring定时器的使用

pring定时器的使用,spring3.0确实是要简单好多,不过很多项目都还没有升级到spring3.0所以对于2.5的配置也需要了解。

2014-04-02

JqueryAjaxPage

JqueryAjaxPage前端分页控件

2014-02-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除