UTF-8 ISO-8859-1 编码

最新推荐文章于 2024-07-12 15:51:39 发布

ningdalong

最新推荐文章于 2024-07-12 15:51:39 发布

阅读量380

点赞数

分类专栏： java 文章标签： java

本文链接：https://blog.csdn.net/ningdalong/article/details/128827067

版权

java 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

package cn.dalong.github.test;

import java.io.IOException;
import java.util.Arrays;
import java.util.LinkedHashMap;
import java.util.Map;

public class PrintTxt {

    public static void main(String[] args) throws IOException {

        // GBK GB2312 Big-5
        // ISO-8859-1 编码是单字节编码，向下兼容ASCII，其编码范围是0x00-0xFF，0x00-0x7F之间完全和ASCII一致，0x80-0x9F之间是控制字符，0xA0-0xFF之间是文字符号。
        // ISO-8859-1 标准中0x80-0xFF为控制字符。ISO-8895-15去除了0x80-0xFF中的控制字符，在0x80-0xFF加入了œ、Œ、Ÿ 、Š、š、Ž、ž等字母和欧元（€）、单引号（‘’）、双引号（“”）、斜体f（ƒ）、省略号（…）、商标（™）、千分号（‰）等常用
        Map<String, Byte> a = new LinkedHashMap<String, Byte>();
        for (int i = 0; i < 256; i++) {
            a.put(pend(Integer.toBinaryString(i)), (byte) (i));
            System.out.println(new String(new byte[] { (byte) (i) }, "ISO-8859-15"));
            System.out.println(new String(new byte[] { (byte) (i) }, "ISO-8859-1"));
        }

        System.out.println(Integer.toBinaryString(0xF0A08080));

        System.out.println(a);
//        * 0000 0000-0000 007F | 0xxxxxxx
//        * 0000 0080-0000 07FF | 110xxxxx 10xxxxxx
//        * 0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx
//        * 0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

        byte[] b1 = { a.get("01100001") };
        byte[] b2 = { a.get("11000100"), a.get("10111000") };
        byte[] b3 = { a.get("11100100"), a.get("10111000"), a.get("10101101") };
        byte[] b4 = { a.get("11110000"), a.get("10100000"), a.get("10000000"), a.get("10000000") };

        System.out.println(Arrays.toString(b1));
        System.out.println(Arrays.toString(b2));
        System.out.println(Arrays.toString(b3));
        System.out.println(Arrays.toString(b4));

        System.out.println(new String(b1, "UTF-8"));
        System.out.println(new String(b2, "UTF-8"));
        System.out.println(new String(b3, "UTF-8"));
        System.out.println(new String(b4, "UTF-8"));

        System.out.println(Arrays.toString("a".getBytes("UTF-8")));
        System.out.println(Arrays.toString("ĸ".getBytes("UTF-8")));
        System.out.println(Arrays.toString("中".getBytes("UTF-8")));
        System.out.println(Arrays.toString("𠀀".getBytes("UTF-8")));
    }

    public static String pend(String a) {
        int length = 8 - a.length();
        for (int i = 0; i < length; i++) {
            a = "0" + a;
        }
        return a;
    }
}