【字符转换】——全角和半角转换

背景

在我们使用搜狗输入法的时候会有全角和半角的切换,首先看一下这两者的区别吧

全角,指一个字符占用两个标准字符位置的状态,也是排字的度量单位,宽度等于所使用的文字的磅数汉。

半角,即一个字符占用一个标准字符的位置,排字的量度单位,宽度等于同一磅数全角的一半。

全角和半角的使用

1、在中文输入法中,切换全角和半角格式的快捷键为SHIFT+空格。

2、一般的系统命令是不用全角字符的,只是在作文字处理的时候才会使用全角字符。

3、在编程序的源代码中只能使用半角标点,但是字符串内部的数据可以使用全角字符或者全角标点。

4、在不支持汉字等语言的计算机上只能使用半角标点。其实,在这种情况下根本就不存在全角半角的概念了。

5、在汉字输入法中,输入的字母数字默认为半角,但是标点则是默认为全角。

6、在进行中文处理时,汉字和标点符号使用全角,字母、其它符号和数字使用半角。即王码五笔字型中的默认输入状态就是。

在进行英文处理时,如:英文输入、编写程序、电子邮件地址、网站URL等。全部使用半角进行处理。

但是我们在日常开发的过程中可能需要对输入的字符进行校验,规则只能是全角字符或者是半角字符,这样我们就需要对校验的字符进行装换,所以才有了这篇文章。

一、代码

/**
 * @author 2019/6/23 16:49
 */
public class CharacterUtil {
    /**
     * 半角对应ASCII表中可见字符从!开始,偏移位值为33(Decimal)
     */
    private static final char DBC_CHAR_START = 33;

    /**
     * 半角对应ASCII表中可见字符到~结束,偏移位值为126(Decimal)
     */
    private static final char DBC_CHAR_END = 126;

    /**
     * 全角对应于ASCII表的可见字符从!开始,偏移值为65281
     */
    private static final char SBC_CHAR_START = 65281;

    /**
     * 全角对应于ASCII表的可见字符到~结束,偏移值为65374
     */
    private static final char SBC_CHAR_END = 65374;

    /**
     * ASCII表中除空格外的可见字符与对应的全角字符的相对偏移
     */
    private static final int CONVERT_STEP = 65248;

    /**
     * 全角空格的值,它没有遵从与ASCII的相对偏移,必须单独处理
     */
    private static final char SBC_SPACE = 12288;

    /**
     * 半角空格的值,在ASCII中为32(Decimal)
     */
    private static final char DBC_SPACE = 32;

    /**
     * <PRE>
     * 半角字符->全角字符转换
     * 只处理空格,!到˜之间的字符,忽略其他
     * </PRE>
     */
    private static String bj2qj(String src) {
        if (src == null) {
            return null;
        }
        StringBuilder buf = new StringBuilder(src.length());
        char[] ca = src.toCharArray();
        for (char c : ca) {
            if (c == DBC_SPACE) { // 如果是半角空格,直接用全角空格替代
                buf.append(SBC_SPACE);
            } else if ((c >= DBC_CHAR_START) && (c <= DBC_CHAR_END)) { // 字符是!到~之间的可见字符
                buf.append((char) (c + CONVERT_STEP));
            } else { // 不对空格以及ascii表中其他可见字符之外的字符做任何处理
                buf.append(c);
            }
        }
        return buf.toString();
    }

    /**
     * <PRE>
     * 全角字符->半角字符转换
     * 只处理全角的空格,全角!到全角~之间的字符,忽略其他
     * </PRE>
     */
    private static String qj2bj(String src) {
        if (src == null) {
            return null;
        }
        StringBuilder buf = new StringBuilder(src.length());
        char[] ca = src.toCharArray();
        for (char c : ca) {
            if (c == SBC_SPACE) {
                buf.append(DBC_SPACE);
            } else if (c >= SBC_CHAR_START && c <= SBC_CHAR_END) {
                buf.append((char) (c - CONVERT_STEP));
            } else {
                buf.append(c);
            }
        }
        return buf.toString();
    }

    public static void main(String[] args) {
        String s1 = "gsrtt art j r sfweegarv 哈哈哈";
        String s2 = "erg Ddca       sdvdv777774aaa好啊 好啊";
        String s3 = " 11";
        String s4 = "  11";
        System.out.println(s1 + "==" + qj2bj(s1));
        System.out.println(s2 + "==" + qj2bj(s2));
        System.out.println(s3 + "==" + qj2bj(s3));
        System.out.println(s4 + "==" + qj2bj(s4));
        System.out.println(s1 + "==" + bj2qj(s1));
        System.out.println(s2 + "==" + bj2qj(s2));
        System.out.println(s3 + "==" + bj2qj(s3));
        System.out.println(s4 + "==" + bj2qj(s4));
    }
}

二、结果验证

Connected to the target VM, address: '127.0.0.1:61997', transport: 'socket'
gsrtt art j r sfweegarv 哈哈哈==gsrtt art j r sfweegarv 哈哈哈
erg Ddca       sdvdv777774aaa好啊 好啊==erg Ddca       sdvdv777774aaa好啊 好啊
 11== 11
  11==  11
gsrtt art j r sfweegarv 哈哈哈==gsrtt art j r sfweegarv 哈哈哈
erg Ddca       sdvdv777774aaa好啊 好啊==erg Ddca       sdvdv777774aaa好啊 好啊
 11== 11
  11==  11
Disconnected from the target VM, address: '127.0.0.1:61997', transport: 'socket'

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值