javaweb的中文编码问题
为什么要编码?
-
因为:
-
在计算机中储存信息的最小单元是1个字节,既8个bit,所以能表示的字节是0-255个
人类要表示的字符太多,无法用一个字节完全表示,要解决这个问题必须要有一个新的数据库char,而从char到byte必须编码。
几种编码:
- ASCLL
- ISO-8859-1
- GB2312
- GBK
- GB18030
- UTF-16
- UTF-8
从使用中文的角度上,有I/O的地方就会涉及编码
-
总结:
- 要解决中文编码问题,首先要搞清楚哪些地方会引起从字符到字节的编码,以及从字节到字符的编码。
java编译原理
java虚拟机规范和java语言规范不是一回事
javac是一种编译器,能将一种语言规范转化为另一种语言的规范
编译器是人和机器沟通的一个纽带
-
词法分析器:
- 词法分析器的作用是将java源文件的字符流转换为对应的Token流。 语法分析器:
- 将词法分析器分析的Token流组成更加结构化的语法树,也就是将一个个单词组建成一句话,一个完整的语句。 语义分析器:
- 在这颗语法树的基础上再做些处理,当所以的这些操作完成后就可以按照这颗完整的语法树生成我们想要的java字节码了。 代码生成器:
- 经过语义分析器完成后的语法树已经非常完善了,接下来java会调用com.sun.toole.javac.jvm.gen类遍历语法树,生成最终的java字节码。