- 博客(2)
- 收藏
- 关注
原创 java实体类生成xml工具
import java.lang.reflect.Field;/** * 实体类生成xml工具 * @author jermon */public class CrawlerJavaBean2Xml {// 文件头编码类型public static final String XML_HEAD_TYPE_UTF8 = "";public static final String XML_HEAD_TY
2015-01-23 15:29:11 1001
原创 网络爬虫三大特性
(1) 传统爬虫,像nutch、hetriex之类的,以爬取简单页面为好,即没有复杂请求的页面。但随着web2.0的兴起,越来越多的网站采用很多动态交互技术如ajax之类的来提升用户体验、需用户登陆才可访问的页面等,它们就无能为力了,或者说需要二次开发的开发成本太高,很多人放弃用它们。(2) 定制爬虫,针对一些大数据平台,如微博、电商、点评网之类的,页面交互复杂、用户登陆后方可访问,往往是需要
2015-01-23 14:20:55 4799
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人