针对控制台和文本输入,检测输入中的西文符号。
以下是 unicode 的编码区段。
0000-001F | C0控制符 | C0 Controls |
0020-007F | 基本拉丁文 | Basic Latin |
0080-009F | C1控制符 | C1 Controls |
00A0-00FF | 拉丁文补充-1 | Latin-1 Supplement |
0100-017F | 拉丁文扩展-A | Latin Extended-A |
0180-024F | 拉丁文扩展-B | Latin Extended-B |
public void write( String str ) throws IOException {
StringBuilder builder = new StringBuilder();
int index = 0;
char ch;
for ( ; index<str.length(); index++ ) {
ch = str.charAt(index);
if ( (32<=(int)ch&&(int)ch<=7*16+15) || (160<=(int)ch&&(int)ch<=2*16*16+4*16+15) )
continue;
builder.append( ch );
}
System.out.print(builder.toString());
}
打开unicode字符集的文本的代码如下:
InputStream in;
in = new FileInputStream(scanner.next());
reader = new BufferedReader(new InputStreamReader(in, "Unicode"));
ps:如何将txt文本保存为unicode字符集? 将文本另存为,在弹出窗口的最下面一行又选择。
如何查看文本的当前字符集? 尝试进入另存为,默认的字符集就是当前字符集。