- 博客(367)
- 资源 (32)
- 收藏
- 关注
原创 Spark 1.2 Standalone Mode 单机安装
1:spark下载,解压[jifeng@jifeng01 hadoop]$ wget http://d3kbcqa49mib13.cloudfront.net/spark-1.2.0-bin-hadoop1.tgz--2015-02-03 21:50:25-- http://d3kbcqa49mib13.cloudfront.net/spark-1.2.0-bin-hadoop1.tgz
2015-02-03 22:24:16 8043
原创 JDK1.1 JDK1.2 JDK1.3 JDK1.4 JDK1.5 JDK1.6 JDK1.7
JDK历史版本下载 http://www.oracle.com/technetwork/java/archive-139210.html
2015-01-23 15:24:45 3646 2
转载 H2数据库攻略
H2是一个开源的嵌入式数据库引擎,采用java语言编写,不受平台的限制,同时H2提供了一个十分方便的web控制台用于操作和管理数据库内容。H2还提供兼容模式,可以兼容一些主流的数据库,因此采用H2作为开发期的数据库非常方便。一、引入Maven依赖在maven中定义H2数据库的版本属性 1.3.172 ataNode对象 }
2015-01-21 23:13:56 5629
转载 深入理解Oracle表(5):三大表连接方式详解之Hash Join的定义,原理,算法,成本,模式和位图
Hash Join只能用于相等连接,且只能在CBO优化器模式下。相对于nested loop join,hash join更适合处理大型结果集 Hash Join的执行计划第1个是hash表(build table),第2个探查表(probe table),一般不叫内外表,nested loop才有内外表 Hash表也就是所谓的内表,探查表所谓的外表
2015-01-20 10:05:55 1684
转载 海量数据 - join处理
本周我们进入join的处理环节,其实在一开始学“连接”这个概念的时候,我感觉最晕菜的事儿是个类Join的区别。left join 、right join 、outer join、inner join 、cross join 。看起来好晕。依照惯例,我主要还是希望从原理的角度来介绍一下join的主要处理方式,这篇只会讲单机处理方式,多机模式我们会在之后的分布式章节进行介绍。先是场景
2015-01-20 09:53:23 2220
转载 Mongodb启动命令mongod参数说明
Mongodb启动命令mongod参数说明mongod的主要参数有: 基本配置----------------------------------------------------------------------------------quiet# 安静输出--port arg# 指定服务端口号,默认端口27017-
2015-01-13 16:20:12 755
转载 MongoDB架构图解
MongoDB架构图解本文图片来自Ricky Ho的博文MongoDB构架(MongoDB Architecture),这是个一听就感觉很宽泛的话题,但是作者在文章中确实对MongoDB由内至外的架构进行了剖析。本文截取了其文章中的几张重点架构示意图片进行简单描述。希望对大家有用。MongoDB数据文件内部结构MongoDB在数据存储上按命名空间来划分,
2015-01-08 10:14:37 2538
原创 SQL解析器的性能测试
对同一个sql语句,使用3种解析器解析出ast语法树(这是编译原理上的说法,在sql解析式可能就是解析器自定义的statement类型),执行1100万次的时间对比。
2014-12-23 21:03:03 8934 1
原创 MongoDB shell 操作
A:连接命令E:\MongoDB\mongodb_64\bin>mongo --helpMongoDB shell version: 2.4.6usage: mongo [options] [db address] [file names (ending in .js)]db address can be: foo foo database on
2014-12-20 17:49:27 2710 1
原创 redmine
select * from issues where id in(425,427,431,434,441,556,446, 456,460,461,462,463, 474,477,481,492,501,503,505,508,509,510,512,514,516,518,519)update issues set start_date=DATE_ADD(start_date,IN
2014-12-19 09:57:00 796
转载 基于openfire+smack的Android、消息推送服务
前言Java领域的即时通信的解决方案可以考虑openfire+spark+smack。当然也有其他的选择。Openfire 是基于Jabber协议(XMPP)实现的即时通信服务器端版本,目前建议使用3.8.1版本,这个版本是当前最新的版本,而且网上可以找到下载的源代码。即时通信客户端可使用spark2.6.3,这个版本是目前最新的release版本,经过测试发现上一版本在视
2014-12-05 13:48:11 10772 4
原创 基于Solr的HBase多条件查询测试
背景:某电信项目中采用HBase来存储用户终端明细数据,供前台页面即时查询。HBase无可置疑拥有其优势,但其本身只对rowkey支持毫秒级的快速检索,对于多字段的组合查询却无能为力。针对HBase的多条件查询也有多种方案,但是这些方案要么太复杂,要么效率太低,本文只对基于Solr的HBase多条件查询方案进行测试和验证。原理:基于Solr的HBase多条件查询原理很简单,
2014-12-05 13:44:56 997 1
转载 每个Java开发者都应该知道的5个JDK工具
摘要:有许许多多的JDK工具呈现在大家面前,但最常用的莫过于java.exe、javac.exe、jar等。除了这几个,还有哪些呢?大家不妨看看本文作者推荐的5个JDK工具。【编者按】JDK是Java语言的软件开发工具包,没有它就无法编译Java程序。目前,有许许多多的JDK工具呈现在大家面前,但最常用的莫过于java.exe、javac.exe、jar等。除了这几个,还有哪些呢?本文
2014-11-21 12:42:51 816
原创 Ubuntu创建用户命令
root@ubuntu100:/home# sudo adduser jifengAdding user `jifeng' ...Adding new group `jifeng' (1004) ...Adding new user `jifeng' (1002) with group `jifeng' ...Creating home directory `/home/jifeng' .
2014-11-19 16:22:52 1442
原创 centos 安装 redmine 2.6.0.stable
必须用root安装1、安装RVM,RVM用于安装ruby[root@jifeng03 ~]# rvm -v-bash: rvm: command not found[root@jifeng03 ~]# curl -L https://get.rvm.io | bash -s stable
2014-11-19 11:31:07 6057
转载 关闭防火墙命令 & 500 OOPS: cannot change directory:
两种方法解决:1、setsebool -P ftp_home_dir on 之后再运service vsftpd restart或 setsebool -P ftpd_disable_trans on 之后再运service vsftpd restart 也行2、关闭selinux修改/etc/selinux/config文件或/etc/syscof
2014-10-30 16:41:27 1255
原创 Apache Hive on Apache Tez
是Apache最新开源的支持DAG作业的计算框架,它直接源于MapReduce框架,核心思想是将Map和Reduce两个操作进一步拆分,即Map被拆分成Input、Processor、Sort、Merge和Output, Reduce被拆分成Input、Shuffle、Sort、Merge、Processor和Output等,这样,这些分解后的元操作可以任意灵活组合,产生新的操作,这些操作经过一些
2014-10-30 16:08:43 7504
原创 安装flume1.5
1:下载wget http://mirrors.hust.edu.cn/apache/flume/1.5.0/apache-flume-1.5.0-bin.tar.gz
2014-10-20 11:29:30 5106 1
原创 centos安装Hue 3.7.0
Hue 是运营和开发Hadoop应用的图形化用户界面。Hue程序被整合到一个类似桌面的环境,以web程序的形式发布,对于单独的用户来说不需要额外的安装。
2014-10-18 23:02:00 7091 4
转载 高并发单例模式
如果在高并发时候,使用这种单例模式 publci class Singleton{ private static Singleton instance = null; private Singleton(){} public static Singleton getInstance(){ if(instance == n
2014-10-18 22:05:57 1173
原创 centos安装Ambari
参考:https://cwiki.apache.org/confluence/display/AMBARI/Install+Ambari+1.6.1+from+Public+Repositories
2014-10-17 23:45:40 14987 2
原创 SSL certificate problem, verify that the CA cert is OK. Details:
使用 git 出现SSL certificate problem, verify that the CA cert is OK. Details:[jifeng@jifeng04 git]$ git clone http://github.com/cloudera/hue.git正克隆到 'hue'...fatal: unable to access 'https://github.com
2014-10-17 22:17:25 3217
原创 redhat编译安装git
1:下载 https://www.kernel.org/pub/software/scm/git/git-1.9.4.tar.gz2:tar
2014-10-17 21:56:20 5492
转载 Redis经验谈
新浪作为全世界最大的Redis用户,在开发和运维方面有非常多的经验。本文作者来自新浪,希望能为业界提供一些亲身经历,让大家少走弯路。使用初衷从2010年上半年起,我们就开始尝试使用Redis,主要出于以下几方面的考虑。性能比MySQL好。因为业务的发展对性能的需求越来越强烈。丰富的数据类型。在速度就是市场的互联网时代,快速开发是一个不变的需求。Cache宕机让人纠结,R
2014-10-16 15:16:22 868
转载 一致性hash算法使用
一、概述 1、我们的memcache客户端(这里我看的spymemcache的源码),使用了一致性hash算法ketama进行数据存储节点的选择。与常规的hash算法思路不同,只是对我们要存储数据的key进行hash计算,分配到不同节点存储。一致性hash算法是对我们要存储数据的服务器进行hash计算,进而确认每个key的存储位置。 2、常规hash算法的应用以及其弊端
2014-10-16 10:24:18 982
原创 hive.ql.exec.DDLTask. MetaException(message:java.io.IOException: Attempt to start meta tracker faile
hive> CREATE TABLE hbase_table_1(key int, value string) > STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' > WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,cf1:val") >
2014-10-08 13:30:29 5593
原创 MySQLSyntaxErrorException: Specified key was too long; max key length is 767 bytes
Hive和HBase整合
2014-10-08 11:11:35 13058 1
原创 Elasticsearch学习
[jifeng@jifeng03 ~]$ curl 'http://jifeng04:9200/?pretty'{ "status" : 200, "name" : "Calypso", "version" : { "number" : "1.1.1", "build_hash" : "f1585f096d3f3985e73456debdc1a0745f512bbc"
2014-09-24 16:26:43 4114 1
原创 CentOS 卸载OpenJdk和Tomcat开机启动
1:查看java[zhoujifeng@gz1-cdc-01 ~]$ java -versionjava version "1.7.0_45"OpenJDK Runtime Environment (rhel-2.4.3.3.el6-x86_64 u45-b15)OpenJDK 64-Bit Server VM (build 24.45-b08, mixed mode)
2014-09-23 18:56:42 2715
转载 十道海量数据处理面试题与十个方法大总结
海量数据处理:十道面试题与十个海量数据处理方法总结作者:July、youwang、yanxionglu。时间:二零一一年三月二十六日本文之总结:教你如何迅速秒杀掉:99%的海量数据处理面试题。有任何问题,欢迎随时交流、指正。出处:http://blog.csdn.net/v_JULY_v。 第一部分、十道海量数据处理面试题1、海量日志数据
2014-09-21 21:47:20 763
原创 mahout贝叶斯分类器测试样例
MAHOUT 0.9版本的贝叶斯分类器测试样例测试非常简单,执行下面这条语句,然后选择第2项就OK了。[jifeng@jifeng01 hadoop]$ $MAHOUT_HOME/examples/bin/classify-20newsgroups.shPlease select a number to choose the corresponding task to run1. cn
2014-09-20 16:08:12 2612
转载 mysql中间件研究(Atlas,cobar,TDDL)
mysql-proxy是官方提供的mysql中间件产品可以实现负载平衡,读写分离,failover等,但其不支持大数据量的分库分表且性能较差。下面介绍几款能代替其的mysql开源中间件产品,Atlas,cobar,tddl,让我们看看它们各自有些什么优点和新特性吧。AtlasAtlas是由 Qihoo 360, Web平台部基础架构团队开发维护的一个基于MySQL协议的数据中间层项
2014-09-18 23:03:15 2403
转载 Mysql在大型网站的应用架构演变
本文主要描述在网站的不同的并发访问量级下,Mysql架构的演变。可扩展性架构的可扩展性往往和并发是息息相关,没有并发的增长,也就没有必要做高可扩展性的架构,这里对可扩展性进行简单介绍一下,常用的扩展手段有以下两种:Scale-up:纵向扩展,通过替换为更好的机器和资源来实现伸缩,提升服务能力Scale-out:横向扩展, 通过加节点(机器)来实现伸缩,提升服务能力
2014-09-18 22:33:29 891
转载 Hadoop计算中的Shuffle过程
Shuffle过程是MapReduce的核心,也被称为奇迹发生的地方。要想理解MapReduce,Shuffle是必须要了解的。我看过很多相关的资料,但每次看完都云里雾里的绕着,很难理清大致的逻辑,反而越搅越混。前段时间在做MapReduce job性能调优的工作,需要深入代码研究MapReduce的运行机制,这才对Shuffle探了个究竟。考虑到之前我在看相关资料而看不懂时很恼火,所以在这里我尽
2014-09-18 22:23:46 1208
hadoop native
2014-08-03
openerp-7.0
2014-07-30
postgresql-9.1.14-1-1
2014-07-30
ImageMagick
2014-02-17
redmine-2.4.3
2014-02-14
subclipse-1.8.22
2013-09-04
hadoop-1.1.2 源代码
2013-07-03
hadoop-1.1.2.tar
2013-07-03
druid-0.2.20
2013-06-29
ActivePerl-5.6.1.635-MSWin32-x86.msi
2010-01-19
用Socket 打造跨语言跨操作系统的网络MORPG游戏
2008-08-03
FLEX+Delphi,FLEX+Java,FLEX+C# 的聊天室
2008-07-18
FLEX+Delphi,FLEX+Java 的聊天室
2008-07-18
中国诗词风
2006-03-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人