- 博客(6)
- 资源 (3)
- 收藏
- 关注
转载 Cygwin运行nutch报错:Failed to set permissions of path
错误信息:Exception in thread "main" java.io.IOException:Failed to set permissions of path:\tmp\hadoop-ysc\mapred\staging\官方BUG参考:https://issues.apache.org/jira/browse/HADOOP-7682
2015-06-25 16:34:34 397
转载 Spark快速入门指南
Spark快速入门指南(Quick Start Spark)最近打算学习spark,正好看到这篇文档,记录下来,这个文档只是简单的介绍如何快速地使用Spark。在下面的介绍中我将介绍如何通过Spark的交互式shell来使用API。转自过往记忆(http://www.iteblog.com/)Basics Spark shell提供一种简单的方式来学习它的AP
2015-06-11 14:04:04 1496
转载 solr MoreLikeThis的原理分析
在solr中有两种方式实现MoreLikeThis:MoreLikeThisHandler和在SearchHandler中的MoreLikeThisComponent。两种方式大同小异:一是:将MoreLikeThis作为一个单独的Handler来处理,体现主体地位。二是:将MoreLikeThis作为一个组件放到SearchHandler中,为Search加入了MLT的功
2015-06-10 17:36:01 688
转载 中文分词技术(中文分词原理)
中文分词技术(中文分词原理)一、 为什么要进行中文分词?词是最小的能够独立活动的有意义的语言成分,英文单词之间是以空格作为自然分界符的,而汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。Lucene中对中文的处理是基于自动切分的单字切分,或者二元切分。除此之外,还有最大切分(包括向前、向后、以
2015-06-10 17:31:48 425
转载 Hadoop中的辅助类ToolRunner和Configured的用法详解
源地址:http://www.it165.net/admin/html/201410/3821.html在开始学习hadoop时,最痛苦的一件事就是难以理解所写程序的执行过程,让我们先来看这个实例,这个测试类ToolRunnerTest继承Configured的基础上实现了Tool接口,下面对其用到的基类源码进行分析,就可以理解其执行过程是如此简单。。。。。。i
2015-06-03 15:17:16 1069
原创 解决tomcat服务器内存溢出
今天在一台新机器上使用tomcat,在启动是竟然出现OOM(内存溢出),看了一下原因,然后改了一下配置,重启成功,步骤如下:1、看一下命令行或log显示的内容就知道了,java.lang.OutOfMemoryError: 就是内存溢出(OOM)2、找到tomcat的bin路径,用编辑器打开catalina.sh3、在echo Using CATALINA_BASE: $CA
2015-06-02 18:30:41 764
EPLAN Electric P8 Reference Handbook 第三版_EN
2016-12-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人