java
三修三元
码农
展开
-
StringUtils使用初探
http://blog.sina.com.cn/s/blog_4550f3ca0100qrsd.html(由于我不太喜欢用新浪博客写技术文章,并且奉行拿来主义【能粘贴的,绝不自己写】,请见谅,这是原地址) 下面分别对一些常用方法做简要介绍: 1. public static boolean isEmpty(String str) 判断某字符串是否为空,为空的标准是st转载 2016-03-29 13:20:33 · 220 阅读 · 0 评论 -
网页数据动态抓去工具之playfish
playfish是一个采用java技术,综合应用多个开源java组件实现的网页抓取工具,通过XML配置文件实现高度可定制性与可扩展性的网页抓取工具 应用开源jar包包括httpclient(内容读取),dom4j(配置文件解析),jericho(html解析),已经在 war包的lib下。 这个项目目前还很不成熟,但是功能基本都完成了。要求使用者熟悉XML,熟悉正则表达式。目前通过转载 2016-03-29 13:24:31 · 1079 阅读 · 0 评论 -
JAVA爬虫 WebCollector
爬虫简介: WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。WebCollector-Hadoop是WebCollector的Hadoop版本,支持分布式爬取。 爬虫内核: WebCollector致力于维护一个稳定、可扩的爬虫内核,便于开发者进行灵活的二次开发。内核具有很强的扩展性,用转载 2016-03-29 13:28:12 · 779 阅读 · 0 评论