- 博客(8)
- 资源 (16)
- 收藏
- 关注
原创 开源爬虫Labin,Nutch,Neritrix介绍和对比
1 1 从网上找了一些开源spider的相关资料,整理在下面: ----------------------------------------------------------------------------------- ************** Larbin 开发语言:C++ http://larbin.sourc
2012-03-30 15:12:55 949
原创 jackrabbit中用xpath进行搜索
jackrabbit支持XPATH与SQL查询: 对于XPATH查询它添加了一些新的函数,主要用到的我看就是这两个: element(nodeName,nodeType)用于选取某类型的节点,其中nodeName可以用*代替,表示选取所有此类型的节点 jcr:contains(propertyName,'value')用于选取具有某属性且值为什么的节点,propertyName可以用.代替表
2012-03-29 17:32:11 1777
原创 jackrabbit中Xpath的用法
smiky 20 boy 欧阳疯 24 girl *XPath的七种节点类型: *元素,属性,文本,文档节点(即根节点),命名空间,注释,处理指令 * *节点关系: *父、子、兄弟、先辈、后代 * *Xpath常用符号: */ 从根节点开始选 *// 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置 (example://name,会选择两个
2012-03-29 17:30:59 1495
转载 JAVA时间的理解
--------它不是原创,是一种思念 Java 语言的Calendar,GregorianCalendar (日历),Date(日期), 和DateFormat(日期格式)组成了Java标准的一个基本但是非常重要的部分. 日期是商业逻辑计算一个关键的部分. 所有的开发者都应该能够计算未来的日期, 定制日期的显示格式, 并将文本数据解析成日期对象。学习日期, 日期格式, 日期的解析和日期
2012-03-29 10:51:05 979
原创 SVN使用说明
SVN使用: 1. 首先是安装TortoiseSVN这个Win下的客户端(当然用subversion自己的svn这个客户端也可以完成所有操作,理论上)。这个客户端是集成到Explore里的,所以没有什么独立的窗体,所有操作右键菜单来完成。 2. svn使用基本流程: 下面说的命令都与TortoiseSVN菜单上的名称一致。 a. 初次(initial)取出(checkout)rep
2012-03-22 14:47:55 632
转载 利用 Heritrix 构建特定站点爬虫
简介: Heritrix 是一个由 java 开发的、开源的网络爬虫,用户可以使用它来从网上抓取想要的资源。其最出色之处在于它良好的可扩展性,方便用户实现自己的抓取逻辑。本文详细介绍了 Heritrix 在 Eclipse 中的配置、运行,最后以抓取北京林业大学网站为例,介绍如何对其进行扩展,实现只抓取特定网站的页面。 <!-- --> 标记本文!
2012-03-14 11:02:53 3796
转载 PO BO VO DTO POJO DAO概念及其作用(转)
J2EE开发中大量的专业缩略语很是让人迷惑,尤其是跟一些高手讨论问题的时候,三分钟就被人家满口的专业术语喷晕了,PO VO BO DTO POJO DAO,一大堆的就来了(听过老罗对这种现象的批判的朋友会会心一笑)。 首先声明偶也不是什么高手,以下总结都是自己的体会。不对之处请您多指教。 PO: persistant object持久对象 最形象的理解就是一个PO就是数
2012-03-08 18:01:22 634
原创 理解 Java 时间, 日期
关于时间,在JavaDoc中谈论比较多文字的是UTC、UT、GMT、TimeZone等 下面是科学的对它们的简单解释。 UTC:科学纪年,时间采自原子时钟。在每过一两年会有一个跳秒,在某个跳点,一分钟有61秒 UT: GMT格林威治时间的科学学名,取自天文学观测。GMT 是标准的“民间”名称;UT 是相同标准的“科学”名称 但java中, GMT的意思是有所不同的。 文中
2012-03-02 09:27:33 2670
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人