获取文件编码 java_java怎么获取文件编码格式？

最新推荐文章于 2024-07-03 02:34:55 发布

户外探险OUTDOOR

最新推荐文章于 2024-07-03 02:34:55 发布

阅读量266

点赞数

文章标签：获取文件编码 java

本文链接：https://blog.csdn.net/weixin_35057850/article/details/114049757

版权

最标准的途径是检测文本最开头的几个字节，开头字节 Charset/encoding,如下表：

EF BB BF　　UTF-8

FE FF　　　 UTF-16/UCS-2, little endian

FF FE　　　 UTF-16/UCS-2, big endian

FF FE 00 00 UTF-32/UCS-4, little endian.

00 00 FE FF UTF-32/UCS-4, big-endian.

int[] head = new int[4];

InputStream inputStream = new FileInputStream(path);

for(int i=0; i<4; i++){

head[0]=inputStream.read();

}

inputStream.close();

String code = "ANSI";

if (head[0]==0xef && head[1]==0xbb && head[2]==0xbf) {

code = "UTF-8";

} else if(head[0]==0xfe && head[1]==0xff) {

code = "utf-16/ucs2, little endian";

} else if(head[0]==0xff && head[1]==0xfe) {

code = "utf-16/ucs2, big endian";

} else if(head[0]==0xff && head[1]==0xfe && head[2]==0x0 && head[3]==0x0) {

code = "UTF-32/ucs4, little endian";

} else if (head[0]==0x0 && head[1]==0x0 && head[2]==0xfe && head[3]==0xff) {

code = "UTF-32/ucs4, big endian";

}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

户外探险OUTDOOR

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

获取文件编码格式 java_java实现获取文本文件的字符编码

weixin_30902415的博客

02-12

2594

一、认识字符编码：1、Java中String的默认编码为UTF-8，可以使用以下语句获取：Charset.defaultCharset();2、Windows操作系统下，文本文件的默认编码为ANSI，对中文Windows来说即为GBK。例如我们使用记事本程序新建一个文本文档，其默认字符编码即为ANSI。3、Text文本文档有四种编码选项：ANSI、Unicode(含Unicode Big Endi...

java获取文件编码格式

01-26

通过webview打开html文件有可能编码不同就会乱码,所以要获取html文件的编码格式动态改变webview编码设置

参与评论您还未登录，请先登录后发表或查看评论

Java判断文件编码格式

zhangzh332的专栏

08-25

6303

一般情况下我们遇到的文件编码格式为GBK或者UTF-8。由于中文Windows默认的编码是GBK，所以一般只要判定UTF-8编码格式。对于UTF-8编码格式的文本文件，其前3个字节的值就是-17、-69、-65，所以，判定是否是UTF-8编码格式的代码片段如下：

java如何判断一个文件的格式编码

最新发布

weixin_33371440的博客

07-03

441

Java如何判断一个文件的格式编码在Java中，判断一个文件的格式编码通常需要读取文件的头部字节，并根据特定的规则进行解析。常见的文件编码格式有UTF-8、UTF-16、ISO-8859-1等。下面将介绍如何使用Java代码判断一个文件的格式编码。读取文件头部字节在Java中，可以通过InputStream来读取文件...

获取文件编码格式(纯JAVA代码，绝对对你有用)

07-30

java 识别文件的编码格式 读取文件的编码 utf-8 gbk gb2312 java 编码 java 获取文件编码格式 java 乱码查找

java 判断是否为cst格式_Java判断文件编码格式

weixin_39737233的博客

12-19

300

1：简单判断是UTF-8或不是UTF-8，因为一般除了UTF-8之外就是GBK，所以就设置默认为GBK。按照给定的字符集存储文件时，在文件的最开头的三个字节中就有可能存储着编码信息，所以，基本的原理就是只要读出文件前三个字节，判定这些字节的值，就可以得知其编码的格式。其实，如果项目运行的平台就是中文操作系统，如果这些文本文件在项目内产生，即开发人员可以控制文本的编码格式，只要判定两种常见的编码就可...

java判断文件编码格式

chiman6219的博客

06-19

435

1：简单判断是UTF-8或不是UTF-8，因为一般除了UTF-8之外就是GBK，所以就设置默认为GBK。按照给定的字符集存储文件时，在文件的最开头的三个字节中就有可能存储着编码信息，所以，基本的原理就是只要读出文件前三个字节，判定这些字节的值，就可以得知其编码的格式。其实，如果...

详解Java如何获取文件编码格式

08-31

在Java编程中，获取文件编码格式是一个常见的需求，特别是在处理跨平台或来自不同来源的文本文件时。本文将深入探讨如何使用Java来识别文件的编码类型，主要关注两种方法：一种是简单的UTF-8与GBK的区分，另一种是...

JAVA获取文件编码格式

03-24

标题提到的“JAVA获取文件编码格式”是一项常见的任务，特别是在处理来自不同来源的文本文件时。在这种情况下，我们可以利用第三方开源库来帮助我们完成这项工作。描述中提到了一个叫做"cpdetector"的工具，这是一个...

Java字符编码及获取文件编码

02-02

本篇文章将深入探讨Java中的字符编码以及如何获取文件的编码。首先，我们了解基本的字符编码体系，如ASCII、ISO-8859-1和Unicode。ASCII是最基础的7位编码，可表示128个不同的字符，主要针对英语字符。ISO-8859-1...

java 获取视频编码_Java如何获取文件编码格式

weixin_30878135的博客

02-12

1619

http://www.cnblogs.com/java0721/archive/2012/07/21/2602963.html1：简单判断是UTF-8或不是UTF-8，因为一般除了UTF-8之外就是GBK，所以就设置默认为GBK。按照给定的字符集存储文件时，在文件的最开头的三个字节中就有可能存储着编码信息，所以，基本的原理就是只要读出文件前三个字节，判定这些字节的值，就可以得知其编码的格式。其实，...

java 获取文件编码

08-22

java工具jar文件获取文件的编码格式 例如UTF-8，GBK，UTF-16,GB2312等等

如何使用Java代码获取文件、文件流或字符串的编码方式.zip

02-11

本工程用于研究如何使用Java代码获取文件、文件流或字符串的编码方式本工程编码方式：UTF-8 开发工具：MyEclipse 参考博客：http://blog.csdn.net/gaohuanjie/article/details/43735891

java获取文件编码

04-21

java获取文件原始编码,

Java如何获得文件编码格式

wangshfa的专栏

02-01

1180

在程序中，文本文件经常用来存储标准的ASCII码文本，比如英文、加减乘除等号这些运算符号。文本文件也可能用于存储一些其他非ASCII字符，如基于GBK的简体中文，基于BIG5的繁体中文等等。在存储这些字符时需要正确指定文件的编码格式；而在读取这些文本文件时，有时候就需要自动判定文件的编码格式。按照给定的字符集存储文本文件时，在文件的最开头的三个字节中就有可能存储着编码信息，所以，基本的原理

Java如何获取文件编码格式

B_H_L的专栏

07-21

4786

获取文件编码 java_Java如何获取文件编码格式

05-23

可以使用 Java 的 InputStreamReader 类来获取文件的编码格式。以下是一个示例代码： ```java File file = new File("file.txt"); InputStream inputStream = new FileInputStream(file); InputStreamReader inputStreamReader = new InputStreamReader(inputStream, Charset.defaultCharset()); System.out.println(inputStreamReader.getEncoding()); ``` 这段代码会输出文件的编码格式。如果文件的编码格式是 UTF-8，那么输出就会是 "UTF-8"。如果文件的编码格式是 GBK，那么输出就会是 "GBK"。注意，这里使用了 Charset.defaultCharset() 来获取系统默认的字符集，你也可以手动指定字符集来获取文件的编码格式。