getBytes方法

Pr Young

已于 2022-08-17 12:01:33 修改

阅读量1.6k

点赞数 1

分类专栏： java 文章标签： java

于 2022-08-17 11:45:21 首次发布

本文链接：https://blog.csdn.net/weixin_47414034/article/details/126381617

版权

java 专栏收录该内容

53 篇文章 0 订阅

订阅专栏

字符串中的字符变成一位一位的01比特流

一个英文字符占8比特，也就是一个字节

一个中文字符占24比特，也就是3个字节（其实不同编码方式，占几个字节不一样，我们这里采取的UTF-8编码方式，具体可以看下图：）

而byte[ ] byte数组里面存的就是每个字节(8位）表示的数字

所以一个英文字符（8比特）只需要1个byte数组的元素就能存下来

而一个中文字符（24比特）需要3个byte数组的元素才能存下来

看下面这个例子：

public class test2
{
    public static void main(String[] args)
    {
        String str="test a,中国，% @";
        //t：116  e：101  s:115  t：116  空格32  逗号：44  % 37  @ 64
        //汉字比较特殊一些：需要16比特来存储，也就是需要两个字节来存储
        //中：-28 -72 -83  国：-27 -101 -67   中文逗号：-17 -68 -116
        byte[]  bytes=str.getBytes();
        for(int b:bytes)
        {
            System.out.println(b);
            //得到：116 101 115 116 32 97 44 -28 -72 -83 -27 -101 -67 -17 -68 -116 37 32 64
        }
    }
}}

附上ASCII表

//输入一串字符（包括汉字，数字，空格，英文字母.....)分别统计出各类的个数
public class test
{
    public static void main(String[] args) throws IOException
    {
        String string=new String("");
        int hanzi=0;//统计汉字的个数
        int zimu=0;//统计字母的个数
        int kongge=0;//统计空格的个数
        int shuzi=0;//统计数字的个数
        int qita=0;
        System.out.println("请输入一行字符：");

        //下面两行代码的意思是：第一行：先将字符串放到缓冲区里面
        //                  第二行：然后将缓冲区的字符串赋给string，这样string就等于我们刚才输入的字符串
        BufferedReader br=new BufferedReader(new InputStreamReader(System.in));
        string=br.readLine();



        byte[] bytes=string.getBytes();

        for(int i=0;i<bytes.length;i++)
        {
            //System.out.println(bytes[i]);
            if((bytes[i]>=65&&bytes[i]<=90)||(bytes[i]>=97&&bytes[i]<=122))  zimu++;
            else if(bytes[i]==32)   kongge++;
            else if(bytes[i]>=48&&bytes[i]<=57)  shuzi++;
            else if(bytes[i]<0)      hanzi++;
            else    qita++;
        }
        System.out.println(zimu);
        System.out.println(hanzi/3);
        System.out.println(kongge);
        System.out.println(shuzi);
        System.out.println(qita);
        
        // 最终的输入输出如下：
        //    java真是太棒了!!  wotaixihuanle  123456
        //    17
        //    5
        //    4
        //    6
        //    2
    }
}

Pr Young

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
getBytes方法

一个中文字符占24比特，也就是3个字节（其实不同编码方式，占几个字节不一样，我们这里采取的UTF-8编码方式，具体可以看下图：）而byte[ ] byte数组里面存的就是每个字节(8位）表示的数字。所以一个英文字符（8比特）只需要1个byte数组的元素就能存下来。而一个中文字符（24比特）需要3个byte数组的元素才能存下来。字符串中的字符变成一位一位的01比特流。一个英文字符占8比特，也就是一个字节。......
复制链接

扫一扫