使用Java将Google书签导出为JSON文件

背景介绍

Google书签是一个非常有用的工具,可以帮助我们管理和存储网页链接。然而,Google书签的导出文件格式是HTML文件,而在某些场景下,我们更希望将这些书签转换成更易于处理的JSON格式。本文将介绍如何使用Java和一些常见的库(如Jsoup和FastJSON),将Google书签导出为JSON文件。

所需工具
  1. Java:主编程语言。
  2. Jsoup:用于解析和处理HTML的Java库。
  3. FastJSON:用于处理JSON的Java库。
  4. Google书签HTML文件:你可以从Google书签中导出。
实现步骤
1. 准备工作

首先,从Google书签导出一个HTML文件。【如何导入导出书签
这个文件包含了所有你在Google书签中保存的书签和分类。保存路径如下所示:

C:\Users\yz\Desktop\googleBookmarks\bookmarks_2024_8_27.html

我们将该文件解析为JSON格式并保存到另一个文件中。

2. 解析HTML并生成JSON

我们将通过以下步骤来实现将HTML文件转换为JSON文件的功能:

  • 解析HTML文件。
  • 提取出所有的书签及其分类。
  • 生成一个包含书签和分类的JSON对象。
  • 将JSON对象写入文件。
3. Java代码实现

以下是Java代码的实现,具体解释见代码中的中文注释。

package com.gzyz.yz.test;

import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.JSONObject;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;

import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import java.util.Objects;

public class GoogleBookmarksToJson {
    public static void main(String[] args) {
        // Google书签HTML文件路径
        String inputFilePath = "C:\\Users\\yz\\Desktop\\googleBookmarks\\bookmarks_2024_8_27.html";
        // 输出的JSON文件路径
        String outputFilePath = "C:\\Users\\yz\\Desktop\\googleBookmarks\\bookmarks.json";

        try {
            // 解析HTML文件为Document对象
            Document doc = Jsoup.parse(new File(inputFilePath), "UTF-8");
            // 解析书签,获取结果集
            List<JSONObject> resultList = analyzeGoogleBookmarks(doc.body().children());
            // 将结果集转换为JSON字符串
            String jsonString = JSON.toJSONString(resultList);
            // 将JSON字符串写入文件
            try (FileWriter fileWriter = new FileWriter(outputFilePath)) {
                fileWriter.write(jsonString);
                System.out.println("书签已成功导出为JSON文件:" + outputFilePath);
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    /**
     * 解析Google书签的方法
     *
     * @param dlElements Document对象
     * @return {@code List<JSONObject>}
     */
    public static List<JSONObject> analyzeGoogleBookmarks(Elements dlElements) {
        // 结果集合
        List<JSONObject> resultList = new ArrayList<>(100);
        //过滤出dl dt元素
        dlElements.stream().filter(child -> Objects.equals(child.tagName(), "dl")).forEach(dlElement ->
                dlElement.children().stream().filter(dlChild -> Objects.equals(dlChild.tagName(), "dt")).forEach(dtElement -> {
                    // 存储书签的JSON对象
                    JSONObject result = new JSONObject();

                    dtElement.children().forEach(dtChild -> {
                        // 分类标题
                        if (Objects.equals(dtChild.tagName(), "h3")) {
                            result.put("category", dtChild.text());
                        }
                        // 书签链接信息
                        if (Objects.equals(dtChild.tagName(), "a")) {
                            result.put("name", dtChild.text());
                            result.put("href", dtChild.attr("href"));
                            result.put("icon", dtChild.attr("icon"));
                        }
                        // 递归解析子书签
                        if (Objects.equals(dtChild.tagName(), "dl")) {
                            result.put("childList", analyzeGoogleBookmarks(new Elements(dtChild)));
                        }
                    });
                    // 添加到结果集合
                    resultList.add(result);
                })
        );
        // 返回结果集
        return resultList;
    }
}
4. 运行代码

在运行该程序后,书签将被成功转换为JSON文件并输出到指定的路径。控制台会显示如下提示:

书签已成功导出为JSON文件:C:\Users\yz\Desktop\googleBookmarks\bookmarks.json
5. 解析逻辑
  • Jsoup库:用于解析Google书签的HTML文件。Jsoup.parse() 方法可以轻松地将HTML文件转换为可操作的Document对象。
  • 过滤与递归解析:程序通过筛选HTML标签中的dldth3a等元素,提取出书签的分类、名称、链接和图标信息。如果一个书签下有子书签,程序会递归解析这些子书签。
  • FastJSON库:用于将解析后的书签数据转换为JSON格式并写入文件。
总结

通过使用Java的Jsoup和FastJSON库,我们可以方便地将Google书签从HTML格式转换为JSON文件。这使得我们可以更轻松地处理书签数据,并应用于其他场景,如数据分析或将书签导入其他系统。

希望这篇文章对你们有所帮助!

  • 9
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ptw-cwl

谢谢老板的打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值