提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
前言
提示:这里可以添加本文要记录的大概内容:
在解析epub文件时,会遇到不标准的epub文件,对epub中的资源文件未作说明,导致epub.js在vue中不显示图,原因是epub文件中的.opf文件<manifest>
标签下缺失图片资源<item>
。本人在解决过程中用到一下思路
方法一(可行):使用开源库epublib(此方法不能修改源文件,是重新生成FileOutputStream、或者文件)
方法二(不可行):使用 java.util.zip 和 jsoup 修改 .opf文件(该方法修改后的文件无法正常打开,只能做为解析epub文件使用)
提示:以下是以第一种方式解决现存问题,下面案例可供参考
一、引入开源库epublib
<dependency>
<groupId>com.positiondev.epublib</groupId>
<artifactId>epublib-core</artifactId>
<version>3.1</version>
</dependency>
二、使用步骤
代码如下(示例):
package com.cnki;
import nl.siegmann.epublib.domain.Book;
import nl.siegmann.epublib.domain.Resource;
import nl.siegmann.epublib.epub.EpubReader;
import nl.siegmann.epublib.epub.EpubWriter;
import nl.siegmann.epublib.service.MediatypeService;
import java.io.*;
import java.util.*;
import java.util.zip.ZipEntry;
import java.util.zip.ZipFile;
/**
* @author bingo
* @Description TODO
* @date 2023/2/20 17:14
*/
public class EpublibTest {
public static void main(String[] args) {
String path = "E:\\Exception\\";
long time = System.currentTimeMillis();
loopFile(path);
long time_end = System.currentTimeMillis();
System.out.println(time_end - time);
}
/**
* 遍历epub文件
* @Description TODO
* @param path
*/
private static void loopFile(String path) {
File file = new File(path);
if (file == null || !file.exists()) {
return;
}
if (file.isDirectory()) {
File[] files = file.listFiles();
if (files == null) {
System.err.println(file + "文件夹访问受限,跳过");
return;
}
for (File f : files) {
if (f.getName().toLowerCase().endsWith(".epub")) {
try {
EpubHandle(f.getPath());
} catch (Exception e) {
System.out.println("处理失败-------" + f.getPath());
}
}
}
}
}
/**
* 根据epub文件生成标准的epub文件,
* 1、如果opf中缺少图片资源,则在当前文件夹下生成_new.epub文件
* 2、正确的epub文件不做处理
* @Description TODO
* @param epubPath
* @throws IOException
*/
public static void EpubHandle(String epubPath) throws IOException {
File file = new File(epubPath);
//如果是生成的文件,则不需要再次处理
if (epubPath.endsWith("_new.epub")) {
return;
}
FileInputStream fileInputStream = new FileInputStream(file);
EpubReader reader = new EpubReader();
Book book = reader.readEpub(fileInputStream);
//文件是否正确
boolean isRightFile = true;
try {
File file_epub = new File(epubPath);
ZipFile file_zip = new ZipFile(file_epub);
Enumeration<? extends ZipEntry> zpi_entries = file_zip.entries();
while (zpi_entries.hasMoreElements()) {
ZipEntry zipEntry = zpi_entries.nextElement();
//获取OPS/images下的图片
if (zipEntry.toString().startsWith("OPS/images/") && zipEntry.toString().length() > 11) {
String str = zipEntry.toString().substring(11);
String id = str.substring(0, str.lastIndexOf("."));
String href = "images/" + str;
//判断资源中是否有存在该图片,如果不存在,则epub文件不正确,并且添加资源到book中
if (!book.getResources().containsByHref(href)) {
isRightFile = false;
book.addResource(new Resource(id, toByteArray(file_zip.getInputStream(zipEntry)), href, MediatypeService.determineMediaType(href)));
}
}
}
//如果epub文件缺少图片资源,就新生成一个带有图片资源的epub文件
if (!isRightFile) {
File new_file = new File(file.getPath().replace(".epub", "_new.epub"));
FileOutputStream fileOutputStream = new FileOutputStream(new_file);
EpubWriter epubWriter = new EpubWriter();
epubWriter.write(book, fileOutputStream);
fileOutputStream.close();
}
} catch (Exception e) {
e.printStackTrace();
}
fileInputStream.close();
}
/**
* @param input
* @return
* @throws IOException
* @Description 将图片InputStream 转Byte
*/
public static byte[] toByteArray(InputStream input) throws IOException {
ByteArrayOutputStream output = new ByteArrayOutputStream();
byte[] buffer = new byte[4096];
int n = 0;
while (-1 != (n = input.read(buffer))) {
output.write(buffer, 0, n);
}
return output.toByteArray();
}
}