运行hadoop错误:localhost:Error:JAVA_HOME is not set

错误:localhost:Error:JAVA_HOME is not set

2014-04-28 13:25:50

阅读数 2216

评论数 0

Hadoop单机伪分布式模式

本机运行环境系统:Ubuntu12.04.4 1.配置

2014-04-28 13:08:30

阅读数 1078

评论数 3

ssh: connect to host localhost port 22: Connection refused 问题

转载:http://blog.csdn.net/jszhangyili/article/details/8881807 命令

2014-04-28 11:37:22

阅读数 1877

评论数 0

Nutch-2.2.1----Nutch过滤URL实践

通过分析Nutch的配置文件Nutch-default.xml和阅读了部分源代码后,了解了Nutch的插件机制以及如何通过修改conf中的文件实现过滤抓取数据。默认情况下,实现URL过滤的类为RegexURLFilter,对应的过滤文件为regex-urlfilter.txt,在不修改该文件的情况...

2014-04-25 15:34:54

阅读数 980

评论数 0

Nutch-2.2.1----过滤抓取数据

在Nutch的conf目录中有automaton-urlfilter.txt、regex-urlfilter.txt、suffix-urlfilter.txt、prefix-urlfilter.txt、domain-urlfilter.txt几个文件用于实现过滤抓取数据,比如不抓取后缀为gif、e...

2014-04-25 15:29:42

阅读数 1064

评论数 0

Nutch2.2.1配置mysql存储

请看我的笔记 http://app.yinxiang.com/shard/s12/sh/668283fe-0c9c-4d17-bb7d-8619774deb64/edb6e47002cc26a26abbc81afca8d6fd

2014-04-24 20:22:18

阅读数 1058

评论数 0

在eclipse中配置Nutch2.2.1, Windows环境下(Linux流程一样)

请看我的笔记: http://app.yinxiang.com/shard/s12/sh/36b8e911-2d0e-4ee4-b34f-a426c6dc99c2/9543f94cd8abf12b4b9857e67709ad42

2014-04-24 20:19:25

阅读数 1988

评论数 2

Crawler4j在Eclipse中的配置

Crawler4j介绍: 主页:https://code.google.com/p/crawler4j/ 网上对于crawler4j这个爬虫的使用的文章很少,Google到的几乎没有,只能自己根据crawler4j的源码进行修改。这个爬虫最大的特点就是简单易用,他连API都不提供。刚开始的时候...

2014-03-21 15:44:37

阅读数 1846

评论数 0

Heritrix1.14.4在Eclipse中的配置

Heritrix的介绍 heritrix的主页:https://webarchive.jira.com/wiki/display/Heritrix/Heritrix#Heritrix-Heritrix1.14.4(May2010) Heritrix 是一个由 java 开发的、开源的网络爬虫,用...

2014-03-21 11:53:51

阅读数 866

评论数 0

Nutch、heritrix、crawler4j优缺点

Nutch: 主页:https://nutch.apache.org/index.html   ApacheNutch是一个高度可扩展的和可伸缩的开源网页爬虫软件项目。源于ApacheLuceneTM,项目多样化,目前由两个代码库组成,即: 1.     Nutch1.x:一个非常成熟的爬...

2014-03-21 09:00:47

阅读数 5065

评论数 1

table的数据行tr上下移动

原文链接:http://www.cnblogs.com/taochen/articles/2344891.html 昨天帮别人解决一个前端页面表格里的数据行上下移动的前端效果,直奔google找了几个demo,发现demo是实现了效果,但是代码很多,最后还是决定自己用jquery写个吧, ...

2014-03-14 21:07:50

阅读数 3850

评论数 2

基本的安全和HTTP认证

原文:http://rivuli-development.com/further-reading/sesame-cookbook/basic-security-with-http-authentication/ Sesame框架附带了一个预包装的web服务(通常被称为Se...

2014-03-12 17:15:23

阅读数 724

评论数 0

Sesame HTTP服务器安装

Sesame HTTP服务器安装 1. 要求的软件 1)Java 6或者更新的版本,下载地址             http://www.oracle.com/technetwork/java/javase/downloads/index.html 2)一个能够支持JavaServlet...

2014-03-10 17:29:42

阅读数 1562

评论数 1

Tomcat--怎样到处使用UTF-8编码

原文地址:https://wiki.apache.org/tomcat/FAQ/CharacterEncoding#Q3 Using UTF-8 as your character encoding for everything is a safe bet. This should ...

2014-03-10 15:39:16

阅读数 723

评论数 0

WordPress本地环境搭建及安装图文教程

Wordpress强大的可扩展性和易用性等功能,使得越来越多的人选择它来建立自己的博客和网站。那么新手朋友该如何入手呢,今天制作这个教程就是旨在帮助新手朋友快速入门,从而为今后WP建站打下坚实的基础。由于是针对初学者,故文中多采用通语言而少用专业术语。 工具/原料 ...

2013-12-02 20:23:35

阅读数 1122

评论数 0

新安装XAMPP,phpMyAdmin错误:#1045 - Access denied for user 'root'@'localhost' (using password: NO)

错误如下: 打开D:\Program Files\xampp\phpMyAdmin(你的xampp的安装目录下的phpMyAdmin目录)目录下的config.inc.php文件 改为 然后,错误就没有了

2013-12-02 09:37:52

阅读数 5827

评论数 0

安装XAMPP时启动Apache失败解决方法 xampp-win32-1.8.3-1-VC11-installer

我现在的XAMP版本是xampp-win32-1.8.3-1-VC11-installer(下载)     Apache启动提示 10:33:43  [Apache]Problem detected! 10:33:43  [Apache]Port 80 in use by "U...

2013-12-02 09:26:53

阅读数 5242

评论数 1

C#将服务器端excel文件下载到客户端的简单方法

上网查了很多方法,可是没有一个方法我测试成功的,然后我就用了一个比较笨但是还算可以用的方法。就是直接将服务器端文件路劲传到前台,用javascript设置a标签的href属性值,然后触发a标签的click事件,让其下载。 1)首先将dataset转换为excel文件,代码如下: ...

2013-11-28 11:20:09

阅读数 1204

评论数 0

Error starting static Resources workspace\.metadata\.plugins\org.eclipse.wst.server.co

严重:   Error   starting   static   Resources  java.lang.IllegalArgumentException: Document base E:\apache-tomcat-5.5.26\webapps\photo does not exist ...

2013-11-27 10:17:03

阅读数 1045

评论数 0

Jena——将本体持久化到MySQL数据库中

将本体持久化到MySQL数据库中 1)开始的时候我使用的Jena的版本为Jena-2.10,该版本提示没有createModelRDBMaker这个方法 2)后来我又换了一个低版本的Jena,版本为2.4.4,运行程序报如下错误: WARN [main] (DriverRDB.java:430) ...

2013-11-18 17:02:13

阅读数 2340

评论数 1

提示
确定要删除当前文章?
取消 删除
关闭
关闭