一行字符串判断字母,数字,空格,和其他字符个数

package cn.xxx;
import java.util.Scanner;

/*输入一行字符加分别统计出其中英文字母、空格、数字和其它字符的个数*/
public class Launch {
    public static void main(String[] args) {
        System.out.println("Please input a sentence:");
        Scanner in=new Scanner(System.in);
        String str=in.nextLine();
        in.close();
        str = str.toLowerCase();
        int nums=0,chars=0,blanks=0,other=0;
        int i = 0;
        while ( i < str.length() ) {
            if ( "abcdefghijklmnopqrstuvwxyz".contains(str.charAt(i)+"") ) {
                chars++;
                i++;
            } else if ( "0123456789".contains(str.charAt(i)+"") ) {
                nums++;
                i++;
            } else if ( " ".contains(str.charAt(i)+"") ) {
                blanks++;
                i++;
            } else{
                /*
                * 关于其他字符用分支的说明。
                * java底层用utf-16实现char的存储,即用16位二进制(一个代码单元)存储char,
                * 但这样最多只能存储2^16=65536个字符,为了解决utf-16溢出
                * 的字符(辅助字符)存储,java采用两个代码单元存储,utf-16码点U+D800-U+DBFF用于第一个代码单元,
                * utf-16码点U+DC00-U+DFFF用于第二个代码单元。而Character.isSupplementaryCodePoint(int cp)
                * 可以判断该代码单元cp是否是辅助字符的代码单元。
                * 对于本题,辅助字符也考虑到了,例如字符𝕆(U+1D546),
                * 如果单纯地用char来判断而注释if语句,会执行两次循环对other++,得到的结果是2,而实际上结果应该是1。
                * */
                int cp = str.codePointAt(i);
                if (Character.isSupplementaryCodePoint(cp)){
                    i+=2;
                } else {
                    i++;
                }
                other++;
            }
        }
        System.out.println("英文字母:"+chars);
        System.out.println("空格:"+blanks);
        System.out.println("数字:"+nums);
        System.out.println("其他字符:"+other);
    }
}

关于其他字符用分支的说明。
                * java底层用utf-16实现char的存储,即用16位二进制(一个代码单元)存储char,
                * 但这样最多只能存储2^16=65536个字符,为了解决utf-16溢出
                * 的字符(辅助字符)存储,java采用两个代码单元存储,utf-16码点U+D800-U+DBFF用于第一个代码单元,
                * utf-16码点U+DC00-U+DFFF用于第二个代码单元。而Character.isSupplementaryCodePoint(int cp)
                * 可以判断该代码单元cp是否是辅助字符的代码单元。
                * 对于本题,辅助字符也考虑到了,例如字符𝕆(U+1D546),
                * 如果单纯地用char来判断而注释if语句,会执行两次循环对other++,得到的结果是2,而实际上结果应该是1。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值