自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

忧郁王子的专栏

伟大的意大利,伟大的罗伯特-巴乔

  • 博客(4)
  • 资源 (13)
  • 收藏
  • 关注

原创 Nutch抓取源码分析之Injector类

(1) 将URL集合进行格式化和过滤,消除其中的非法URL,并设定URL状态(UNFETCHED),按照一定方法进行初始化分值;(2) 将URL进行合并,消除重复的URL入口;(3) 将URL及其状态、分值存入crawldb数据库,与原数据库中重复的则删除旧的,更换新的。inject方法public void inject(Path crawlDb, Path urlD

2012-01-30 15:16:19 1454

原创 Nutch抓取源码分析之Crawl类

1、初始化一个Configuration实例设置抓取工作配置;2、设置一些默认抓取工作参数,比如进程数threads、抓取深度depth、抓取网页数量topN;3、创建抓取工作抓取到的网页文件的存放目录(crawldb、linkdb、segments、indexes、index),用来存放原生网页,以及网页解析出的文本内容及其其它相关数据;4、在抓取工作及其索引过程中,这通过初始化一些

2012-01-30 15:09:53 2796

原创 成长过程-2012

恐怖的2012就在眼前,都说是世界末日,在末日到来之前先把今年要办的事情列一下,今年要做的三件事:(1)结婚。 (2)结婚旅游。(3)通过北航的在职研究生考试。2012年1月,回到茶陵过年,一家子人其乐融融。感慨时间的飞快,父母都渐渐老去。2012年2月,去菜百市场买了结婚的钻戒和项链,消费2W人民币。2012年2月,买了电动车,消费人民币2400.2012年3月,四维数据更新组流

2012-01-28 22:52:29 2544

原创 unicode和汉字互转

Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码(定长码),也是一种前缀码。它可以用来表示Unicode标准中的任何字符 /** *

2012-01-06 13:22:22 3779

Hadoop 2.5.2安装和部署

从0开始一步一步安装和部署Hadoop 2.5.2

2015-12-29

Lucene研究,Lucene 读书笔记

一、 全文检索的基本概念 (1)、数据总体分为两种:结构化数据和非结构化数据。 结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等。 非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等。 (2)、索引(Index):将非结构化数据中的一部分信息提取出来,重新组织,使其变得有一定结构,然后对此有一定结构的数据进行搜索,从而达到搜索相对较快的目的。

2011-08-17

Maven简易教程,maven 自动构件,自动测试,自动发布

maven 自动构件,自动测试,自动发布

2011-08-17

Java 操作World

POI本来相对就不稳定,而且操作word功能较弱.而且操作Word的例子很少,读写excel的倒是蛮多的 。jacob是个不错的选择,也就是java-com桥

2010-07-29

Java 调用C/C++程序

JAVA以其跨平台的特性深受人们喜爱,而又正由于它的跨平台的目的,使得它和本地机器的各种内部联系变得很少,约束了它的功能。解决JAVA对本地操作的一种方法就是JNI。   JAVA通过JNI调用本地方法,而本地方法是以库文件的形式存放的(在WINDOWS平台上是DLL文件形式,在UNIX机器上是SO文件形式)。通过调用本地的库文件的内部方法,使JAVA可以实现和本地机器的紧密联系,调用系统级的各接口方法。

2010-07-29

飞鸽,ipmsg.exe局域网工具

比较好的局域网工具,聊天,传送文件 ipmsg.exe

2008-11-05

sqlserver sp4补丁

sqlserver sp4补丁 microsoft SqlServer 200 sp4

2008-11-05

jad Java反编译工具

不错的java反编译工具 jad HashMap.class

2008-11-05

js校验库validator

js通用的校验库 常用严重,邮箱,电话,身份证,字符,数字,自定义

2008-11-05

effective java

effective java读书笔记 (1) Object 通用方法(equals(),hashCode(),toString(),clone(),finalize()) (2) 类和接口 (3) 方法 (4)通用设计方法 (5) 异常

2008-11-05

J2ME编程入门PPT

J2ME编程基础 配置 MyEclipse 中进行J2ME开发 J2ME 数据库开发 WAP 基础开发

2008-09-26

JMeter 压力测试详解PPT

众多类型的软件测试中,压力测试正是以软件响应速度为测试目标,尤其是针对在较短时间内大量并发用户的访问时,软件的抗压能力。这次共同学习压力测试工具JMeter,简单介绍了如何使用它来完成常用的压力测试:Web 测试、数据库测试和 JMS 测试。

2008-09-26

软件工程.pdf

软件工程讲述“软件开发” 和做“程序员” 的道路

2008-05-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除