第三方jar包解读文件编码

最新推荐文章于 2023-03-01 08:43:32 发布

shy_snow

最新推荐文章于 2023-03-01 08:43:32 发布

阅读量4.8k

点赞数 7

本文链接：https://blog.csdn.net/shy_snow/article/details/6497538

版权

Code:

package test;
//import cpdetector.io.*;
import info.monitorenter.cpdetector.io.CodepageDetectorProxy;
import info.monitorenter.cpdetector.io.JChardetFacade;
import java.io.*;
import java.nio.charset.*;
public class PageCode {
public static void main(String args[]) {
CodepageDetectorProxy detector = CodepageDetectorProxy.getInstance();
detector.add(JChardetFacade.getInstance());
Charset charset = null;
File f = new File("D:/test/1.xls");
try {
charset = detector.detectCodepage(f.toURL());
} catch (Exception e) {
e.printStackTrace();
}
if (charset != null) {
System.out.println(f.getName() + "编码是：" + charset.name());
} else
System.out.println(f.getName() + "未知");
}
}

原理：

Code:

import java.io.*;
public class TestText {
public static void main(String args[]){
File file = new File("C:/1.txt");
try{
InputStream stream = new FileInputStream(file);
byte[] byteArray = new byte[3];
stream.read(byteArray);
stream.close();
if (byteArray[0] == -17 && byteArray[1] == -69 && byteArray[2] == -65)
System.out.println("UTF-8");
else
System.out.println("可能是其他的编码");
}
catch(Exception e){
e.printStackTrace();
}
}
}

http://blog.csdn.net/justinavril/archive/2008/08/07/2783266.aspx

jar包下载地址：
http://ncu.dl.sourceforge.net/project/cpdetector/cpdetector/binaries/cpdetector_1.0.7_binary.zip

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

shy_snow

关注关注

7
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
第三方jar包解读文件编码

复制链接

扫一扫

JChardet jar包，封装类.rar

03-15

https://blog.csdn.net/shefron/article/details/38874617 鱼泽弋海封装的Jchardet类以及chardet.jar，感觉是网上找到的例子里写的很好的。 Jchardet，会返回一个最有可能的charset，和一组其他可能，正确率还行，但在数据很少的情况下，出错率会变高，可以用RadioGroup试试几种常用的可能就好。

java使用jchardet检测文本文件(字节流)的编码方式

03-28

NULL 博文链接：https://zhifeiji512.iteye.com/blog/1221068

参与评论您还未登录，请先登录后发表或查看评论

Java如何获取上传的二进制字节流中的文件编码格式以及解决文件乱码问题

平凡之路无尽路的博客

10-18

6381

通过UltraEdit查看文件编码格式可得：bgk是没有文件字符集编码格式头的，所以在可以通过下面方式大略判断。 GB2312-80编码的编码范围是高位0xa1－0xfe，低位是0xa1-0xfe，其中汉字范围为0xb0a1和0xf7fe，如果只是简单地判断汉字，则只要查看高字节是否大于等于0xa1就可以了，还有就是，全角字符的高字节统统等于0xa3，所以很容易可以区别出全角字符来。 ...

字符集编码的自动识别jchardet

xiangxingchina

10-27

178

什么是jchardet? jchardet是mozilla自动字符集探测算法代码的java移植,其源代码可以从sourceforge下载。这个算法的最初作者是 frank Tang,C++源代码在http://www.infomall.cn/cgi-bin/mallgate/20040514/http: //lxr.mozilla.org/mozilla/source/intl/ch...

Sping基础jar包

10-12

4. **spring-context-support.jar**：这个模块扩展了spring-context，添加了对第三方库如Quartz（定时任务）、JMS（Java消息服务）和邮件服务的支持。它使得Spring能够更好地与其他企业级服务集成。 5. **spring-...

J2ME-Antenna学习文档资料

10-08

3. **第三方Jar包集成**：在`Wtkbuild`和`Wtkpackage`属性中指定classpath，通过`<fileset>`标签引入外部库。 #### 五、Antenna实践小贴士 - 在使用Antenna前，确保阅读官方文档和Ant入门教程，掌握基本的Ant语法...

Audio Analysis-开源

05-09

例如，它可能包含了Java的Sound API或者其他第三方音频处理库，如JAVE（Java Audio Video Encoder）用于音频转换，或者FFmpeg的Java接口用于处理多媒体数据。这些库为项目提供了底层的支持，使得开发者无需从零开始...

XSS脚本注入拦截框架 antisamy

04-06

为了帮助完成解析和过滤任务，AntiSamy集成了第三方库Xerces、Batik和NekoHTML。 - **Xerces**：用于XML解析，确保策略文件能够正确解读。 - **Batik**：提供SVG处理能力，对于包含SVG图形的网页而言至关重要。 - *...

JVM配置参数说明

07-22

11. **-extdirs**: 指定扩展目录的位置，用于查找第三方库。 12. **-endorseddirs**: 指定已认可目录的位置，用于存放标准库的替代实现。 13. **-d**: 指定编译后的.class文件的输出目录。 14. **-encoding**: ...

jchardet.jar chardet.jar jchardet-1.1.zip

11-03

jchardet-1.1.zip jchardet-1.1.zip 包含源码及jar。 jchardet-1.1.zip

java使用jchardet检测文本文件(字节流)的编码方式（转）

07-28

NULL 博文链接：https://nopainnogain.iteye.com/blog/771041

Java判断文件编码

weixin_58094032的博客

03-01

603

同时还需jchardet-1.0.jar这个包，否则detector.add(cpdetector.io.JChardetFacade.getInstance());还有一个antlr.jar，不然运行过程中detector.add(new ParsingDetector(false));主要jar包：cpdetector.jar。

主题：判定文件编码或文本流编码的方法

zenith_hu的专栏

09-06

710

在程序中，文本文件经常用来存储标准的ASCII码文本，比如英文、加减乘除等号这些运算符号。文本文件也可能用于存储一些其他非ASCII字符，如基于GBK的简体中文，基于GIG5的繁体中文等等。在存储这些字符时需要正确指定文件的编码格式；而在读取这些文本文件时，有时候就需要自动判定文件的编码格式。按照给定的字符集存储文本文件时，在文件的最开头的三个字节中就有可能存储着编码信息，所以，基本的原理就

JAVA判断文件编码类型

djun100的专栏

09-04

361

java读取文件，处理过程中，可能因为文件的编码问题导致了中文乱码。有时需要将UTF-8的改为ANSI的编码。以下代码就可以判断文件是什么编码方式。主要jar包：cpdetector.jar 下载地址http://cpdetector.sourceforge.net/ 同时还需jchardet-1.0.jar这个包，否则detector.add(cpdetector.io.JChard...

使用JCharDet，获得文件的字符集编码！

guojg的专栏

08-08

4523

需要jchardet-1.0.jar包。 package p; import java.io.BufferedInputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; imp

JAVA读取文件字符集【File、MultipartFile、cpdetector】

u011292296的博客

08-21

960

一、简介 cpdetector：是一款基于JAVA的文件编码方式检测工具二、导入cpdetector的jar包 下载地址：https://mvnrepository.com <dependency> <groupId>net.sourceforge.cpdetector</groupId> <artifactId>cpdetecto...

Android 西班牙语字幕乱码 && 字符编码

muxi@Achilles的专栏

06-29

4822

今天碰到一个西班牙语字幕乱码的问题。首先使用JcharDet jar包验证字幕文件编码类型为：windows-1252 其实和 ISO8859-1 类似。将其转化为万能的UTF-8 或者UTF-16就ok了一篇很详细对各种字符编码进行述说的文章：http://www.crifan.com/files/doc/docbook/char_encoding/release/html/c

Jchardet——支持检测并输出文件编码方式的组件

OpenHarmony_dev的博客

10-12

461

支持的编码格式有：ASCII编码、UTF-8编码、UTF-16LE编码、Shift-JIS编码、ISO-2022-JP编码、ISO－2022－CN编码、ISO-2022-KR编码、Big５编码、UTF-16BE编码、x-euc-tw编码、EUC－KR编码、ECU－JP编码、GB18030编码、HZ－GB－2312编码、Windows-1252编码、GB2312编码。4.1 向编码检测器提供数据，首选判断是否Ascii编码，如果是Ascii编码，则程序结束。2. 在page页面导入。3. 初始化编码检测器。

maven 批量安装第三方jar包工具