- 博客(7)
- 资源 (8)
- 收藏
- 关注
转载 Crawler4j在Eclipse中的配置
Crawler4j介绍:主页:https://code.google.com/p/crawler4j/网上对于crawler4j这个爬虫的使用的文章很少,Google到的几乎没有,只能自己根据crawler4j的源码进行修改。这个爬虫最大的特点就是简单易用,他连API都不提供。刚开始的时候实在恨不能适应。好在他的源码也提供了几个例子。对于一般的应用大可以直接修改它的例子。Crawler
2014-03-21 15:44:37 2176
原创 Heritrix1.14.4在Eclipse中的配置
Heritrix的介绍heritrix的主页:https://webarchive.jira.com/wiki/display/Heritrix/Heritrix#Heritrix-Heritrix1.14.4(May2010)Heritrix 是一个由 java 开发的、开源的网络爬虫,用户可以使用它来从网上抓取想要的资源。其最出色之处在于它良好的可扩展性,方便用户实现自己的抓取逻辑
2014-03-21 11:53:51 990
原创 Nutch、heritrix、crawler4j优缺点
Nutch:主页:https://nutch.apache.org/index.html ApacheNutch是一个高度可扩展的和可伸缩的开源网页爬虫软件项目。源于ApacheLuceneTM,项目多样化,目前由两个代码库组成,即:1. Nutch1.x:一个非常成熟的爬虫产品。1.x版本支持细粒度的配置,依赖于一个很好的分布式处理的ApacheHadoop数据结构。
2014-03-21 09:00:47 5613 1
转载 table的数据行tr上下移动
原文链接:http://www.cnblogs.com/taochen/articles/2344891.html昨天帮别人解决一个前端页面表格里的数据行上下移动的前端效果,直奔google找了几个demo,发现demo是实现了效果,但是代码很多,最后还是决定自己用jquery写个吧,首先将前端效果分析出编程逻辑,上下移动就是将数据行互换位置,互换为之前判断是否置顶或则最后一个,翻
2014-03-14 21:07:50 4629 2
翻译 基本的安全和HTTP认证
原文:http://rivuli-development.com/further-reading/sesame-cookbook/basic-security-with-http-authentication/Sesame框架附带了一个预包装的web服务(通常被称为Sesame server)。这个web服务作为一个在线的RDF数据库服务器,有多个SPARQL查询端点和
2014-03-12 17:15:23 897
原创 Sesame HTTP服务器安装
Sesame HTTP服务器安装1. 要求的软件1)Java 6或者更新的版本,下载地址 http://www.oracle.com/technetwork/java/javase/downloads/index.html2)一个能够支持JavaServlet API2.4和Java Server Pages(JSP)2.0或者它们更新的版本的Java Ser
2014-03-10 17:29:42 1964 1
转载 Tomcat--怎样到处使用UTF-8编码
原文地址:https://wiki.apache.org/tomcat/FAQ/CharacterEncoding#Q3Using UTF-8 as your character encoding for everything is a safe bet. This should work for pretty much every situation.In order to
2014-03-10 15:39:16 888
charles 3.10.2破解文件
2015-07-08
graphviz2.28
2013-04-08
火车票务系统(c语言编写的)
2011-10-24
数据结构教材 严蔚敏教材 习题集答案
2011-08-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人