自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 资源 (21)
  • 问答 (1)
  • 收藏
  • 关注

原创 ssh localhost失败

如果ssh localhost返回这样的提示:Agent admitted failure to sign using the key 、解决方案:      添加id_rsa到ssh-agent :  ssh-add id_rsa      如果提示: “Could not open a connection to your authentication ag

2014-12-27 11:18:12 570

原创 java.lang.OutOfMemoryError: Java heap space

出现这种异常,明显是jvm内存不够得原因,要修改所有的datanode的jvm内存大小。在hadoop-0.20.2/conf/mapred-site.xml里设置一下hadoop的mapred.child.java.opts。该值默认为200M。在文件中添加如下键值对:mapred.child.java.opts-Xmx512M

2014-12-18 21:10:31 474

转载 hadoop :java.io.FileNotFoundException: File does not exist:

点击打开链接转自:http://blog.163.com/silver9886@126/blog/static/35971862201441134010403/1.用hadoop的eclipse插件下M/R程序的时候,有时候会报Exception in thread "main" java.lang.IllegalArgumentException: Pathname

2014-12-18 21:04:08 20475

转载 Doxygen + Graphviz windows下的看源码神器

转自:http://www.java123.net/v/511979.html 查看一些开源代码经常被一些函数的调用关系给绕进去,经过网上查阅资料,发现了这个好用的方法,拿出来和大家分享下安装和应用的过程。本人常用windows系统,所以主要讲解下windows下相关的内容要使用doxygen生成漂亮的调用关系图,那就必须安装下图形生成工具graphviz软件,要通过html生成c

2014-12-17 15:49:03 492

原创 源码分析Hadoop FileInputFormat如何分片

Hadoop采用的是分布式并行计算的模式来处理大数据,在处理时必然要对数据进行分片,将数据由大化小,将一个大的任务化为几个小的任务,这就是hadoop处理大数据的核心思想。        这里要讨论的是hadoop对数据进行分割的方片,这里的分片是逻辑上的,不同于Hdfs对数据的分块,分片并没有改变数据的存储位置。分片在hadoop中由InputFormat这个类体系来完成。

2014-12-17 15:14:55 940

转载 使用Eclipse的几个必须掌握的快捷方式

转发自:http://doggou.javaeye.com/blog/211741“工若善其事,必先利其器”,感谢Eclipse,她 使我们阅读一个大工程的代码更加容易,在阅读的过程中,我发现掌握几个Eclipse的快捷键会使阅读体验更加流畅,写出来与诸君分享,欢迎补充.1. Ctrl+左键 这个是大多数人经常用到的,用来查看变量、方法、类的定义2. Ctrl+O 

2014-12-16 11:22:23 345

原创 异常eclipse Hadoop Failed to set permissions of path的解决

eclipse Hadoop Failed to set permissions of pathwindow下在eclipse中执行hadoop程序时报错,如下:原因文末有写(来自网友),所有的解决方案都是修改FileUitl文件,然后重新编译hadoop核心包,替换现有的hadoop核心包。其实没有那么麻烦,只要在scr目录下重新建包,包里面包含FiltUitl类,将之前的FileUit

2014-12-15 20:30:34 1917

原创 配置Paoding分词时出现的错误:java.lang.AbstractMethodError: org.apache.lucene.analysis.TokenStream.incrementTo

出现异常:在使用lucene3与paoding集成的时候可能会出现以下错误:Exception in thread "main" java.lang.AbstractMethodError: org.apache.lucene.analysis.TokenStream.incrementToken()Z at org.apache.lucene.index.DocInverterPer

2014-12-15 13:35:42 2531

原创 Hadoop生态系统参考书

2014-12-14 19:39:52 618

原创 北风网Hadoop套餐教程 Hive 入门实战:Mysql+Hive

1,本例将hadoop的错误日志经过Hive导入到mysql中。这里不讨论实验的实际意义,目的是通过调用Hive的java API,加深对Hive的理解,熟悉Hive的运用。2,实验的逻辑:2.1,将hadoop的日志交由Hive数据仓库管理。2.2,由Hive数据仓库对日志数据进行清理,将error级别的日志信息导入到mysql数据库中。逻辑上其实及其简单:将hadoop日志导入

2014-12-14 18:11:38 1296

原创 如何解决Eclipse下“找不到或无法加载主类”的错误

转发自:http://blog.sina.com.cn/s/blog_7ebc46500101gtff.html有时候 Eclipse 会发神经,好端端的 project 就这么编译不了了,连 Hello World 都会报“找不到或无法加载主类”的错误,我已经遇到好几次了,以前是懒得深究就直接重建project了,但遇到次数多了必须深究下了,现总结几种解决方案,大家根据自己的情况逐一尝

2014-12-14 16:37:31 19062 6

原创 Hive 用户自定义函数UDF详解

本例自定义一个Hive UDF函数,功能是将从Hive数据仓库查询出来的字符串进行大小写转换。第一步,创建java工程,添加jar包。 Ø导入Hive的lib目录下的jar包以及hadoop安装目录下的hadoop-core.jar第二步,新建package包,包中新建java类,该类一定要继承org.apache.hadoop.hive.ql

2014-12-14 10:09:21 8400

原创 基于虚拟机的centos版本linux操作系统如何联网

1,我的环境:win7,Oracle  VM VirtualBox,centos2,修改配置文件:/etc/sysconfig/network-scripts/ifcfg-eth0文件,如下:3,设置网络连接方式

2014-12-13 22:17:04 422

转载 centos中文输入法设定

此文为转发,原文地址:http://blog.csdn.net/newizan/article/details/19012233 centos 6.4用yum安装中文输入法1.需要root权限,所以要用root登录 ,或su root2.yum install "@Chinese Support"3.exit4.回到桌面,system->preferences-

2014-12-13 22:04:18 613

原创 Hive分区、分桶操作及其比较

1,Hive分区。 是指按照数据表的某列或某些列分为多个区,区从形式上可以理解为文件夹,比如我们要收集某个大型网站的日志数据,一个网站每天的日志数据存在同一张表上,由于每天会生成大量的日志,导致数据表的内容巨大,在查询时进行全表扫描耗费的资源非常多。那其实这个情况下,我们可以按照日期对数据表进行分区,不同日期的数据存放在不同的分区,在查询时只要指定分区字段的值就可以直接从该分区查找。

2014-12-13 17:39:29 27394 3

原创 Hive的数据类型

Hive支持的数据类型如下:原生类型:TINYINTSMALLINTINTBIGINTBOOLEANFLOATDOUBLESTRINGBINARY (Hive 0.8.0以上才可用)TIMESTAMP (Hive 0.8.0以上才可用)复合类型:arrays: ARRAYmaps: MAPstructs: STRUCTunion: UNIONTYPE我没有从数据类型本身

2014-12-13 15:06:02 511

原创 Hive简介和安装

1,Hive是基于hadoop的数据仓库解决方案,由facebook贡献给Apache。Hive出现的初衷是让不熟悉编程的数据分析人员也能够使用hadoop处理大数据,这是怎么实现的呢?2,我们先来看看Hive提供的接口,从下面Hive的架构图中可以很明显的看出来,Hive 提供了Hive shell,JDBC/ODBC,Web接口来使用和管理Hive数据仓库。Hive的shell

2014-12-12 11:00:41 1090

原创 Mahout推荐系统构建

参考博客:1,Mahout推荐算法基础。http://blog.csdn.net/ppcat_001/article/details/77368222,用Maven构建Mahout项目。http://blog.fens.me/hadoop-mahout-maven-eclipse/Mahout的推荐引擎已经高度模块化,用户能基于Mahout用极简单的代码构建自己的推荐引擎。这篇

2014-12-11 15:02:47 897

sqopp1.4.6.zip

sqopp1.4.6是常用的hadoop生态圈的数据采集、数据同步工具

2021-11-28

hudi-spark3-bundle_2.12-0.10.0-SNAPSHOT.jar

spark读取hudi,hudi版本0.10

2021-11-27

2.Hadoop-lzo.7z lzo源码+包

hdfs默认不支持lzo压缩,需要通过将lzo源码融入hadoop源码,重新编译hadoop源码;或者编译lzo源码生成jar,作为插件使用

2021-11-21

bank_record.csv

hbase bluk load测试数据

2021-06-03

MomoHbase.7z

学习hbase使用的数据制作工具,仿照momo聊天数据格式

2021-06-01

squirrelsqlclientxz.7z

数据连接客户端,连接phoenix 安装方式: java -jar D:\software\sqlc_41579\squirrelsqlclientxz\squirrel-sql-3.7.1-standard.jar

2021-06-01

hadoop2.7.5-Windows版.zip

编译过的Hadoop2.7.5windows版本,拿来即用,内含hadoop.dll、winutils.exe等,还有说明文档:https://blog.csdn.net/epitomizelu/article/details/115717801

2021-04-15

nffaoalbilbmmfgbnbgppjihopabppdk.zip

适合chrome的倍速播放器

2021-03-19

kibana-7.2.0-linux-x86_64.tar.gz.zip

kibana-7.2.0-linux-x86_64.tar.gz官网免费

2021-01-16

20191107141751chromecj.com.zip

Forest电脑版是一款非常有趣的培养专注高效率生活习惯软件

2019-11-07

java多线程设计模式

java多线程设计模式,12个重要的线程设计模式和全书总结以及丰富的附录内容。每一章相关线程设计模式的介绍,都举一反三使读者学习更有效率。最后附上练习问题,让读者可以温故而知新,能快速地吸收书中的精华,书中最后附上练习问题解答,方便读者学习验证。

2016-01-23

基于GIS的数量方法与应用(附书实验文档1)

基于GIS的数量方法与应用(附书实验文档的第一部分),文档重现了书中的每个案例的详细步骤,是Arcgis入门和空间分析入门必备之书

2016-01-23

基于GIS的数量方法与应用(附书数据)

基于GIS的数量方法与应用(附书数据),王法辉教授的著作,适合Arcgis和空间分析的入门

2016-01-23

空间数据分析与R实践

R具有两大功能统计计算和制图。以往空间数据分析是GIS软件的领地,其他软件很少染指。R很早就具有空间数据分析的功能,但是少为人所知道。这本书是由R核心开发组中负责开发空间数据分析的人士边写软件同时边著就的教材。

2016-01-05

R语言编程艺术

R语言编程艺术,内容清晰,有目录,适合入门,无私分享

2015-12-18

Search Everything

对windows的文件系统进行索引,可以快速查找文件系统中的文件和目录,比Windows自带的查找功能块1万倍

2015-12-16

统计建模与R软件

统计建模与R软件,非常经典的r入门书籍,共享

2015-12-16

MapReduce.Design.Patterns

大牛推荐的hadoop学习参考书,英文版,读起来可能有点困难,但却是好书,坚持读下去会有很大收获

2014-12-14

Hadoop 经典书籍 Hadoop MapReduce CookBook

hadoop开发经典数据,完整版本,来自hadoop大牛推荐

2014-12-14

winscp516setup.exe

这是window文件系统和linux文件系统远程通信的工具,可以用来在两个文件系统间互传文件

2014-12-14

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除