【网络爬虫】HttpClient抓取+解析+存储数据

本文详细介绍了如何使用HttpClient进行网络数据抓取,然后结合自定义的JSON工具类进行数据解析,并利用文件IO工具类将解析后的数据存储。通过封装和测试各个工具类,实现了完整的数据处理流程。
摘要由CSDN通过智能技术生成

前面使用了HttpClient抓取数据(http://blog.csdn.net/tsj11514oo/article/details/71023314),现在我们就要进行对数据的解析和存储。实现整一套的流程:抓取——解析——存储。重点是封装了工具类。

结构:

这里写图片描述

代码:

(1)封装转JSON工具类:

```
    package com.tsj.simple.utils;   
    import java.util.Iterator;  
    import org.json.simple.JSONArray;
    import org.json.simple.JSONObject;
    import org.json.simple.JSONValue;   
    /**
     * json解析工具类
     * @author tsj-pc
     */
    public class JsonOperatorUtil {
   
            public static JSONObject toJSONObject(String str) {
                    return (JSONObject) JSONValue.parse(str);
            }   
            public static JSONArray toJSONArray(String str) {
                    return (JSONArray) JSONValue.parse(str);
            }   
            public static void main(String[] args) {
                    String str = "[{\"one\":1,\"two\":\"2\"}]";
    //      JSONObject jsonObject = JsonOperatorUtil.toJSONObject(str);
            JSONArray jsonObject = JsonOperatorUtil.toJSONArray(str);           
            Iterator<JSONObject> iterator=jsonObject.iterator();
            while
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值