java实现针对控制台和文本输入,检测输入中的西文符号

针对控制台和文本输入,检测输入中的西文符号。

以下是 unicode 的编码区段。

Roadmap to Unicode BMP-zh.svg

0000-001FC0控制符C0 Controls
0020-007F基本拉丁文Basic Latin
0080-009FC1控制符C1 Controls
00A0-00FF拉丁文补充-1Latin-1 Supplement
0100-017F拉丁文扩展-ALatin Extended-A
0180-024F拉丁文扩展-BLatin Extended-B
所以想要查找到西文字符只要在 0020-007F和00A0-024F两个编码区段中比对就行了。代码如下:

public void write( String str ) throws IOException {	
	StringBuilder builder = new StringBuilder();
	int index = 0;
	char ch;
	for ( ; index<str.length(); index++ ) {
		ch = str.charAt(index);
		if ( (32<=(int)ch&&(int)ch<=7*16+15) || (160<=(int)ch&&(int)ch<=2*16*16+4*16+15) )
			continue;
		builder.append( ch );
	}
	System.out.print(builder.toString());
}

打开unicode字符集的文本的代码如下:

InputStream in;
in = new FileInputStream(scanner.next());
reader = new BufferedReader(new InputStreamReader(in, "Unicode"));


ps:如何将txt文本保存为unicode字符集? 将文本另存为,在弹出窗口的最下面一行又选择。

如何查看文本的当前字符集? 尝试进入另存为,默认的字符集就是当前字符集。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值