java以特定编码解析字符串_如何解析与Java编码不同的字符串

最新推荐文章于 2022-02-19 15:09:05 发布

weixin_39749501

最新推荐文章于 2022-02-19 15:09:05 发布

阅读量153

点赞数

文章标签： java以特定编码解析字符串

本文链接：https://blog.csdn.net/weixin_39749501/article/details/114716665

版权

我有一个从Word文档中读取的字符串。我认为它采用“ Cp1252”编码。Java使用UTF8。

如何在该字符串中搜索Cp1252中的那些特殊字符并将其替换为适当的UTF8字符？

具体来说，我想将“ En Dash”字符替换为普通的“-”

以下代码块采用了来自Word文档的projDateString，并尝试执行此操作

char[] test = projDateString.getBytes("Cp1252");

for(int i = 0; i < test.length; i++){

System.out.println "test["+ i + "] = " + Integer.toHexString((byte)test[i]);

}

String projDateString2 = new String(test);

projDateString2.replaceAll("\0x96", "\u2013");

System.out.println("projDateString2: " + projDateString)

我不确定我是否正确设置了projDateString2。如您所见，当我使用Cp1252编码在字符串上获取字节时，该破折号的十六进制值为ffffff96。如果我使用UTF8来获取字节数，则它作为3个十六进制值而不是1个。

这给了我以下输出：

test[0] = 30

test[1] = 38

test[2] = 2f

test[3] = 32

test[4] = 30

test[5] = 31

test[6] = 30

test[7] = 20

test[8] = ffffff96

test[9] = 20

test[10] = 50

test[11] = 72

test[12] = 65

test[13] = 73

test[14] = 65

test[15] = 6e

test[16] = 74

projDateString2: 08/2010 ΓÇô Present

如您所见，替换并没有执行任何操作，并且println仍然为我提供了垃圾字符，而不是纯文本“-”

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39749501

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

java 字符串指定编码输出_java对字符的编码处理

weixin_42355399的博客

02-16

5392

在java应用软件中，会有多处涉及到字符集编码，有些地方需要进行正确的设置，有些地方需要进行一定程度的处理。1. getBytes(charset)这是java字符串处理的一个标准函数，其作用是将字符串所表示的字符按照charset编码，并以字节方式表示。注意字符串在java内存中总是按unicode编码存储的。比如"中文"，正常情况下(即没有错误的时候)存储为"4e2d 6587"，如果char...

JavaTxt解析文本代码或输出指定编码文本

04-10

Java代码中一个解析Txt文本编码的工具类，可以根据指定文件路径判断文本文件的编码格式，相对于简单通过文本长度的判断而言多了更多的判断类型，能够比较准确的判断文本类型，导入即用，比较方便

参与评论您还未登录，请先登录后发表或查看评论

字符串编码解析代码分析

小Y

05-13

767

字符串根据不同编码（gbk，utf8等），进行编译需要和数据库oracle存储验证：特别要注意的是中文字符（在数据库中占用3个位） public static void main(String[] args) { String lenString = "abc12打卡"; System.out.println(lenString.length()); try { System.out

java 编码与解码_Java 字符编码与解码

weixin_35171513的博客

03-05

213

1、字符编码的发展历程①、ASCII 码因为计算机只认识数字，所以我们在计算机里面的一切数据都是以数字来表示，因为英文字符有限，所以规定使用的字节的最高位是 0，每一个字节都是以 0-127 之间的数字来表示。比如 A 对应 65，a 对应 97。这便是美国标准信息交换码，ASCII123String str =newString("Aa");byte[] strASCII = str.get...

java 字符串指定编码输出_字符串编码解析及字符编码输出

weixin_35338620的博客

02-24

813

package字符编码输出;importjava.io.FileInputStream;importjava.io.FileNotFoundException;importjava.io.FileOutputStream;importjava.io.IOException;importjava.io.InputStreamReader;importjava.io.OutputStreamWrite...

Java编码和解码必须一致吗_Java 字符编码与解码

weixin_33282146的博客

02-26

309

1、字符编码的发展历程①、ASCII 码因为计算机只认识数字，所以我们在计算机里面的一切数据都是以数字来表示，因为英文字符有限，所以规定使用的字节的最高位是 0，每一个字节都是以 0-127 之间的数字来表示。比如 A 对应 65，a 对应 97。这便是美国标准信息交换码，ASCII②、GB2312 码随着计算机在全球的普及，很多国家和地区都把自己的字符引入了计算机，比如汉字。此时发现一个字节能...

java实现解析二进制文件的方法(字符串、图片)

08-31

在本篇文章中，主要介绍了如何使用Java语言来解析包含字符串和图片的二进制文件。这一过程涉及到对二进制数据的读取和解析，具体实现的方法包括读取字符串的长度和内容，以及图片的数据长度和内容。下面将详细展开...

TLV.zip_409的tlv编码_TLV解码_TLV解码java_tlv编码 c++_tlv编码解析

09-19

它可以是任意类型的数据，如字符串、数字、二进制数据等。值的大小由长度字段定义。 **TLV编码的实现** 在给定的压缩包文件中，`TLV.cpp`可能包含了一个C++实现的TLV编码和解码功能。在C++中，实现TLV编码通常涉及...

java_SMS.rar_OperaXML.java_java s_java sms_java 串口_java_sms

最新发布

09-23

在Java程序中，这些AT指令通常以字符串形式构造，然后通过串口发送到连接的设备。 3. **OperaXML**： OperaXML可能是项目中使用的特定库或框架，用于处理XML格式的短信。XML是一种结构化数据格式，常用于数据交换...

Java Json字符串的双引号("")括号如何去掉

10-14

在Java编程中，处理Json字符串时，我们可能会遇到需要去除字符串中的特定字符，例如双引号，以便符合Json规范或者解决解析错误的情况。本篇主要讨论如何去除Java Json字符串中的双引号，并针对可能出现的问题提供...

Java如何处理json字符串value多余双引号

10-15

在Java程序开发中，JSON（JavaScript Object Notation）格式的字符串常用于前后端数据交换。然而，在处理JSON字符串时，可能会出现一些格式错误，比如value值中包含多余的双引号，这种情况可能会影响数据的正确解析...

lzstring4j:基于LZ的Java压缩算法

05-07

lzstring4j-Java的LZString lzstring4j是Java的的易于使用的实现。这个想法是受启发的。特征：基于JavaScript LZString库（版本1.3.3） UTF-16压缩 Base64压缩通过这篇通过UTF-16压缩方法（Java Server-> Web上的JS或Node.js服务器上的-> Java Client / Android）与JavaScript库进行互操作。如何使用使用lzstring4j非常简单。但让我们看看：签出并编译项目： git clone https://github.com/diogoduailibe/lzstring4j.git cd lzstring4j mvn clean install 然后，使用MavenDependecy导入项目 < dependency> < groupId>c

String字符串编码解码格式

风子的博客

10-10

2万+

String字符串编码解码格式 String.getBytes()//方法是得到一个操作系统默认的编码格式的字节数组。 String.getBytes(String decode)//方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示 new String(byte[] b,String decode)//按照指定的方法编码正常的编码解码 byt...

Java 字符串中的编码和解码

weixin_46441425的博客

02-19

562

java 解析字符串_java字符串解析

weixin_33835122的博客

02-21

1239

我们先要记住三者的特征：String 字符串常量StringBuffer 字符串变量(线程安全)StringBuilder 字符串变量(非线程安全)一、定义查看API会发现，String、StringBuffer、StringBuilder都实现了 CharSequence接口，虽然它们都与字符串相关，但是其处理机制不同。String：是不可改变的量，也就是创建后就不能在修改了。StringBuf...

java按指定编码写入和读取文件内容的类