- 博客(4)
- 资源 (3)
- 收藏
- 关注
原创 【网络爬虫】HttpClient抓取+解析+存储数据
前面使用了HttpClient抓取数据(http://blog.csdn.net/tsj11514oo/article/details/71023314),现在我们就要进行对数据的解析和存储。实现整一套的流程:抓取——解析——存储。重点是封装了工具类。结构:代码:(1)封装转JSON工具类:``` package com.tsj.simple.utils; import jav
2017-04-30 17:25:34 3386 3
原创 【网络爬虫】使用HttpClient4.3.5抓取数据
使用jar——Apache client下载地址: http://hc.apache.org/downloads.cgi 结构: 代码结构:具体代码:抓取结果封装/** * 抓取结果的封装 * @author tsj-pc * */public class CrawlResultPojo { private boolean isSuccess; private St
2017-04-30 15:32:14 1907 2
原创 【 网络爬虫】java 使用Socket, HttpUrlConnection方式抓取数据
结构:公共方法url任务的pojo类import com.tsj.simple.enumeration.TaskLevel;/** * url任务的pojo类 * @author tsj-pc */public class UrlPojo { public UrlPojo(String url) { this.url = url; } @Overr
2017-04-29 22:23:53 2891 2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人