Java 下载网络图片,根据字节流判断文件类型,并补充扩展名 通过URL下载网络文件,获取文件流并修改文件名

参考并感谢 Java 读取图片文件的类型(MimeType) - 煮过的花朵 - 博客园

仅针对部分图片格式进行处理,其他文件类型可以自行补充。

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.URL;
import java.net.URLEncoder;
import java.nio.charset.StandardCharsets;
import java.util.UUID;

public class EzImageUtil {

	public final static String TYPE_JPEG = "jpeg";
	public final static String TYPE_PNG = "png";
	public final static String TYPE_GIF = "gif";
	public final static String TYPE_WEBP = "webp";
	public final static String TYPE_BMP = "bmp";
	public final static String TYPE_ICO = "ico";

	public static void main(String[] args) throws IOException {
		String savePath = "e:/";
		String urlStr = "http://图片地址";
		String filename = downloadImgFromUrl(urlStr, savePath);
		System.out.println(filename);
	}

	/**
	 * 从输入流中获取字节数组
	 * 
	 * @param inputStream
	 * @return
	 * @throws IOException
	 */
	public static byte[] readInputStream(InputStream inputStream)
			throws IOException {
		byte[] buffer = new byte[1024];
		int len = 0;
		ByteArrayOutputStream bos = new ByteArrayOutputStream();
		while ((len = inputStream.read(buffer)) != -1) {
			bos.write(buffer, 0, len);
		}
		bos.close();
		return bos.toByteArray();
	}

	/**
	 * 从网络Url中下载文件
	 */
	public static String downloadImgFromUrl(String urlStr, String savePath) throws IOException {
		String fileName = UUID.randomUUID().toString().replaceAll("-", "");
		if (urlStr.contains("\\u")) {
			urlStr = ascii2native(urlStr);
		}
		System.out.println("info:downloadImgFromUrl " + urlStr);
		urlStr = urlStr.replaceAll(" ", "%20").replaceAll("!", "%21").replaceAll("'", "%27").replaceAll("\\(", "%28")
				.replaceAll("\\)", "%29").replaceAll("~", "%7E");
		URL url = new URL(urlStr);
		HttpURLConnection conn = (HttpURLConnection) url.openConnection();
		// 设置超时间为3秒
		conn.setConnectTimeout(3 * 1000);
		// 防止屏蔽程序抓取而返回403错误
		conn.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");
		conn.setRequestProperty("Charset", "UTF-8");

		// 得到输入流
		InputStream inputStream = conn.getInputStream();
		// 获取自己数组
		byte[] getData = readInputStream(inputStream);
		// 文件保存位置
		File saveDir = new File(savePath);
		String filePath = saveDir + File.separator + fileName;
		File file = new File(filePath);
		FileOutputStream fos = new FileOutputStream(file);
		fos.write(getData);
		if (fos != null) {
			fos.close();
		}
		if (inputStream != null) {
			inputStream.close();
		}
		
		String type = readType(filePath);
		copyFile(filePath, filePath + "." + type);
		ifExistFileDelete(filePath);
		return fileName + "." + type;
	}

	/**
	 * 读取文件类型
	 * 
	 * @param filename
	 * @return
	 * @throws IOException
	 */
	private static String readType(String filename) throws IOException {

		FileInputStream fis = null;
		try {
			File f = new File(filename);
			if (!f.exists() || f.isDirectory() || f.length() < 8) {
				throw new IOException("the file [" + f.getAbsolutePath() + "] is not image !");
			}

			fis = new FileInputStream(f);
			byte[] bufHeaders = readInputStreamAt(fis, 0, 8);
			if (isJPEGHeader(bufHeaders)) {
				long skiplength = f.length() - 2 - 8; // 第一次读取时已经读了8个byte,因此需要减掉
				byte[] bufFooters = readInputStreamAt(fis, skiplength, 2);
				if (isJPEGFooter(bufFooters)) {
					return "jpeg";
				}
			}
			if (isPNG(bufHeaders)) {
				return "png";
			}
			if (isGIF(bufHeaders)) {

				return "gif";
			}
			if (isWEBP(bufHeaders)) {
				return "webp";
			}
			if (isBMP(bufHeaders)) {
				return "bmp";
			}
			if (isICON(bufHeaders)) {
				return "ico";
			}
			throw new IOException("the image's format is unkown!");

		} catch (FileNotFoundException e) {
			throw e;
		} finally {
			try {
				if (fis != null)
					fis.close();
			} catch (Exception e) {
			}
		}

	}

	/**
	 * 标示一致性比较
	 * 
	 * @param buf
	 *            待检测标示
	 * @param markBuf
	 *            标识符字节数组
	 * @return 返回false标示标示不匹配
	 */
	private static boolean compare(byte[] buf, byte[] markBuf) {
		for (int i = 0; i < markBuf.length; i++) {
			byte b = markBuf[i];
			byte a = buf[i];

			if (a != b) {
				return false;
			}
		}
		return true;
	}

	/**
	 * 
	 * @param fis
	 *            输入流对象
	 * @param skiplength
	 *            跳过位置长度
	 * @param length
	 *            要读取的长度
	 * @return 字节数组
	 * @throws IOException
	 */
	private static byte[] readInputStreamAt(FileInputStream fis, long skiplength, int length) throws IOException {
		byte[] buf = new byte[length];
		fis.skip(skiplength); //
		fis.read(buf, 0, length);
		return buf;
	}

	// BMP图片文件的前两个字节
	private static boolean isBMP(byte[] buf) {
		byte[] markBuf = "BM".getBytes();
		return compare(buf, markBuf);
	}

	private static boolean isICON(byte[] buf) {
		byte[] markBuf = { 0, 0, 1, 0, 1, 0, 32, 32 };
		return compare(buf, markBuf);
	}

	// WebP图片识别符
	private static boolean isWEBP(byte[] buf) {
		byte[] markBuf = "RIFF".getBytes();
		return compare(buf, markBuf);
	}

	private static boolean isGIF(byte[] buf) {
		// GIF识别符
		byte[] markBuf = "GIF89a".getBytes();
		if (compare(buf, markBuf)) {
			return true;
		}
		// GIF识别符
		markBuf = "GIF87a".getBytes();
		if (compare(buf, markBuf)) {
			return true;
		}
		return false;
	}

	// PNG识别符
	private static boolean isPNG(byte[] buf) {
		byte[] markBuf = { (byte) 0x89, 0x50, 0x4E, 0x47, 0x0D, 0x0A, 0x1A, 0x0A };
		// new String(buf).indexOf("PNG")>0 //也可以使用这种方式
		return compare(buf, markBuf);
	}

	// JPEG开始符
	private static boolean isJPEGHeader(byte[] buf) {
		byte[] markBuf = { (byte) 0xff, (byte) 0xd8 };
		return compare(buf, markBuf);
	}

	// JPEG结束符
	private static boolean isJPEGFooter(byte[] buf) {
		byte[] markBuf = { (byte) 0xff, (byte) 0xd9 };
		return compare(buf, markBuf);
	}

	public static void copyFile(String src, String desc) throws IOException {
		FileInputStream input = new FileInputStream(src);
		FileOutputStream output = new FileOutputStream(desc);
		byte[] b = new byte[1024 * 64];
		int len;
		while ((len = input.read(b)) != -1)
			output.write(b, 0, len);
		output.flush();
		output.close();
		input.close();
	}

	public static void ifExistFileDelete(String filename) {
		try {
			File file = new File(filename);
			if (file.exists()) {
				FileUtils.forceDelete(file);
			}
		} catch (IOException e) {
			e.printStackTrace();
		}
	}

	public static String ascii2native(String asciicode) {
		String[] asciis = asciicode.split("\\\\u");
		String nativeValue = asciis[0];
		for (int i = 1; i < asciis.length; i++) {
			String code = asciis[i];
			try {
				nativeValue += (char) Integer.parseInt(code.substring(0, 4), 16);
				nativeValue += code.substring(4, code.length());
			} catch (Exception e) {
				nativeValue += "\\u" + code;
			}
		}
		return nativeValue;
	}

}
  • 4
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
Java 中可以使用 `java.nio.file.Files.probeContentType(Path path)` 方法来获取文件的 MIME 类型。该方法会根据文件扩展名和内容来尝试确定文件的 MIME 类型。但是该方法不是完全可靠的,因为它依赖于操作系统和 Java 运行时环境的设置。 如果需要更可靠的方式来判断文件类型,可以使用开源库 Apache Tika。Apache Tika 是一个用于检测和提取元数据的工具包,可以识别超过 1500 种不同的文件格式。以下是使用 Apache Tika 判断文件类型的示例代码: ```java import java.io.File; import java.io.FileInputStream; import java.io.IOException; import org.apache.tika.detect.Detector; import org.apache.tika.detect.MagicDetector; import org.apache.tika.metadata.Metadata; import org.apache.tika.mime.MediaType; import org.apache.tika.parser.AutoDetectParser; import org.apache.tika.parser.Parser; import org.apache.tika.sax.BodyContentHandler; public class FileTypeDetector { public static void main(String[] args) throws IOException { File file = new File("/path/to/file"); FileInputStream stream = new FileInputStream(file); // 使用 MagicDetector 判断文件类型 Detector detector = new MagicDetector(); MediaType mediaType = detector.detect(stream, new Metadata()); System.out.println("MIME 类型:" + mediaType.toString()); // 使用 AutoDetectParser 获取文件内容 Parser parser = new AutoDetectParser(); BodyContentHandler handler = new BodyContentHandler(); Metadata metadata = new Metadata(); parser.parse(stream, handler, metadata); System.out.println("文件内容:" + handler.toString()); } } ``` 在上面的示例中,我们先使用 MagicDetector 判断文件类型,然后使用 AutoDetectParser 获取文件内容。如果需要更详细的元数据信息,可以在 Metadata 对象中获取。需要注意的是,使用 Apache Tika 需要添加对应的依赖包。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值