自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

lucene控制台配置

从网上下了lucene2.9.0的包,开始着手研究;看到那些大牛们提到在控制台窗口中进行了研究,所以自己很想试试看: 1)解压缩lucene2.9.0的包后,会看到lucene-core-2.9.0.jar和lucene-demos-2.9.0.jar这两个包 2)将这两个jar包配置到系统环境变量classpath中 3)打开一个控制台终端,在其中运行相关命令即...

2009-10-18 21:26:38 140

原创 Collection 和 Collections的区别。

Collections是个java.util下的类,它包含有各种有关集合操作的静态方法。Collection是个java.util下的接口,它是各种集合结构的父接口。List, Set, Map是否继承自Collection接口? List,Set是 Map不是ArrayList和Vector的区别。一.同步性:Vector是线程安全的,也就是说是同步的,而A...

2009-07-11 17:37:56 104

搜索引擎(1)

(一)搜素引擎工作原理的两个重要的很容易混淆的问题:1)当用户提交查询的时候,搜索引擎[color=red]并不是[/color]即刻在web上“搜索”一通,发现那些相关的网页,形成列表呈现给用户;而是[color=blue]事先已“搜集”了一批网页,以某种方式存放在系统中[/color],此时的搜索只是在系统内部进行而已。2)当用户感到返回结果列表中的某一项很可能是他需要的,从而点击UR...

2009-07-08 20:32:06 188

原创 IT精英,必须掌握的命令行

一,ping     它是用来检查网络是否通畅或者网络连接速度的命令。作为一个生活在网络上的管理员或者黑客来说,ping命令是第一个必须掌握的DOS命令,它所利用的原理是这样的:网络上的机器都有唯一确定的IP地址,我们给目标IP地址发送一个数据包,对方就要返回一个同样大小的数据包,根据返回的数据包我们可以确定目标主机的存在,可以初步判断目标主机的操作系统等。下面就来看看它的一些常用的操作。...

2009-06-29 22:32:32 112

原创 20年后,你会比现在更幸福吗?

记得小时候,我很憧憬长大。因为我觉得等长大了,父母就再也管不着我了。可以想喝凉水就喝凉水,中午想不睡觉就不睡觉,那一定很幸福。等我真的长大,父母也的确管不着了,可当初认为的幸福并没有到来。因为,虽然没有人再管我喝凉水,但我发现当初那个理想太微不足道。而且,在得到这个微不足道的自由的同时,又有了新的更大的不自由。比如八点上班,哪怕迟到5分钟,领导也要给脸色看。而且那脸色,比小时候父母的难看得多。...

2009-06-27 21:49:39 95

Heritrix的总体架构

爬虫hertrix中的关键的几个类是:1)CrawlOrder2)CrawlController3)Frontier链接制造工厂以及BdbFrontier的实现方式4)多线程的实现(ToeThread和ToePool)5)处理链和Processer...

2009-06-27 11:10:05 97

原创 阅读源代码3

最后,对于在这篇文章中提到的分析源代码程序的一些方法做一下小结,以作为本文的结束。分析一个源代码,一个有效的方法是:1、阅读源代码的说明文档,比如本例中的README, 作者写的非常的详细,仔细读过之后,在阅读程序的时候往往能够从README文件中找到相应的说明,从而简化了源程序的阅读工作。2、如果源代码有文档目录,一般为doc或者docs, 最好也在阅读源程序之前仔细阅读,因为这些文...

2009-06-27 00:38:11 69

原创 阅读源代码2

由于工作的关系,我常常需要读一些源代码,并在上面做一些修改并且拿来使用,或者是借鉴其中的某些部分。可以说,open source对于程序员来说,是很有意义的事情。根据我的经验,读源代码,至少有3个好处。第一个好处是可以学习到很多编程的方法,看好的源代码,对于提高自己的编程水平,比自己写源代码的帮助更大。当然不是说不用自己写,而是说,自己写代码的同时,可以从别人写的好的源代码中间学习...

2009-06-27 00:37:29 234

原创 阅读源代码1

最近有做源码阅读的事情,觉得有些费尽,做了一些思考。一个大项目的源代码,不要过份详细的阅读。大项目,其代码量基本上是可以吓死人的。过份的关注细节,常常会拘泥于细节,而忽略了整体框架。当你能够看清框架的时候,亦花费了太多的时间。因此,阅读一个大项目的源代码,其目的不在于欣赏代码细节,而在于迅速看清项目整体框架的大概面貌:都有那些模块,这些模块是干嘛的(不关心具体怎么干),模块之间的通讯机制大...

2009-06-27 00:35:54 138

原创 java与C++的不同

java和c++的相似之处多于不同之处,但两种语言问几处主要的不同使得Java更容易学习,并且编程环境更为简单。我在这里不能完全列出不同之处,仅列出比较显著的区别:1.指针JAVA语言让编程者无法找到指针来直接访问内存无指针,并且增添了自动的内存管理功能,从而有效地防止了c/c++语言中指针操作失误,如野指针所造成的系统崩溃。但也不是说JAVA没有指针,虚拟机内部还是使用了...

2009-06-25 14:52:57 72

原创 摩托罗拉面试题3

  c/c++:  1. static在c,c++中有什么不同点  2. 堆和栈的区别  3. 纯虚函数  4. 指针和引用的区别  5. 如果构造函数出错,如何处理?  6. 对设计模式是否熟悉,用过哪些?  7. c++如何使用c中的函数,为什么?  数据结构:  8. AVL,不懂,平衡二叉树,唉,咋叫这缩写呢 ...

2009-06-25 14:50:30 108

原创 摩托罗拉面试题2

1、智能指针,com实现的原理,2、printf()可变参数如何实现3、标准模板库vector追加数据如何实现。是底层如何实现,不能用现有的东东。4、还有,java的垃圾收集机制如何实现为什么?如果是你自己实现垃圾收集机制,如何实现? 用什么数据结构。5、二叉排序树和哈希表那个查找效率高,实用于pda 。6、.net的底层实现机制。7、进程间通信如何...

2009-06-25 14:49:44 103

原创 摩托罗拉面试题1

1.介绍一下STL,详细说明STL如何实现vector。Answer:STL (标准模版库,Standard Template Library.它由容器算法迭代器组成。STL有以下的一些优点:可以方便容易地实现搜索数据或对数据排序等一系列的算法;调试程序时更加安全和方便;即使是人们用STL在UNIX平台下写的代码你也可以很容易地理解(因为STL是跨平台的)。vect...

2009-06-25 14:47:51 109

爬虫的几个关键技术点

最近在研究爬虫的实现,看了几个代码,感觉在爬虫的设计中有几点很重要:1)网页的获取2)网页中URL的提取3)URL的合法性校验4)URL是否已经存在5)网页的深度的判断6)爬去策略?深度优先和广度优先...

2009-06-25 11:20:09 1410

CDL面试题(关于电信)

今天去IBM的CDL参加了面试,面试官提问了几个关于java基础的题,搞得我很郁闷。。。。1)java的clone2)java中的一个类中如何实现一个类的实例3)java中的一个类如何访问另一个类的方法,有几种方法4)设计模式中的单实例模式中若两个用户同时访问那个类,则单实例模式是否还起作用?5)java中的关键字public,private,protected,以及默认的属性...

2009-06-25 11:16:33 82

原创 开始学习搜索引擎

今天花了半天的时间将lucene2.0+Heritrix的第一个简单的小例子看明白啦。。。。。虽然涉及到Lucene的一些用法还是稀里糊涂 :( ,但是毕竟迈出了第一歩,加油哈。。。。...

2009-06-20 17:51:16 95

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除