自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 java中MD5算法使用

java标准库中的java.security包下的MessageDigest类提供了消息摘要算法的基本实现,包括SHA-1,SHA-256,MD5等算法。消息摘要算法是一种安全的哈希算法,将任意长度的数据哈希映射成一定长度的哈希值。package egg.util;import java.security.MessageDigest;public class StringUtils {

2012-06-20 22:44:49 1454

原创 java正则表达式笔记

Java正则表达式     笔记根据网络资料整理而成,有些注解写的是自己的理解,可能会错误,欢迎大神指正。正则表达介绍正则表达式是一种用于字符串模式匹配和替换的强有力的工具,通过使用一系列特殊字符形成字符串模板,来描述字符串集合。正则表达式使用一系列匹配操作符,形成比较简单的表达式。通过替换不同的通配符就能形成不同字符串。正则表达式在实际应用中,主要有数据有效性(或者存在性)验证和

2012-05-24 09:16:11 729

原创 Eclipse使用中遇到的一个Access restriction问题

在Eclipse使用中遇到的一个Access restriction问题,问题报错如下:Access restriction: The type FileURLConnection is not accessible due to restriction on required library C:\Java\jre7\lib\rt.jar网上的一个办法是:这个是eclip

2012-04-19 16:28:19 1313

原创 Heritrix1.14.4抓取任务设置

笔者初学网络爬虫,经过搜索相关信息,发现heritrix 1.14.x的参考资料较多一点,而且直接通过WebUI定制的参数比3.x要多一些(3.x要直接配置craw-beans.cxml),适合初学者,所以决定先从heritrix 1.14.4学起了。1、运行Heritrix。(也可以导入到eclipse里面运行)1) 压缩包解压,以文本编辑方式打开 /heritrix/conf 下的

2012-04-15 21:51:40 1332

原创 Heritrix 3.x快速运行你的第一个爬行程序

1、下载heritrix3.0或heritrix3.1,解压。运行cmd,进入到bin目录下(如笔者的目录:cd D:\heritrix-3.1.0\bin)。运行命令:heritrix -a admin:admin ,这里冒号前面admin是用户名,后面是密码,这样将会在另一个新建的窗口中运行heritrix程序。在浏览器地址栏输入https://localhost:8443,注意这

2012-04-12 15:02:00 4821 2

原创 nutch 1.4在windows下安装配置

nutch 1.4在windows下的安装配置0、介绍Apache Nutch 是用java语言开发的开源网页爬虫程序。使用Nutch可以自动获取网页中的超链接,在检查坏链接,创建遍历过的网页副本以便查询等方面,将会减少大量的维护工作。也由此产生了Apache Solr。Solr是一个开源的全文搜索框架,通过Solr我们可以搜索Nutch遍历过的网页。而且Nutch和Solr的集成十分

2012-03-26 09:00:34 1287 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除