什么是字符集和编码
什么是字符集(Charset)
- 字符集就是字符的集合,一般会包含一种语言的字符,比如 GBK 是包含所有常用汉字字符的字符集。ASCII 是包含英文字符的字符集
- 字符就是Java中的char(character)
什么是编码(Encoding)
- char代表一个字符 char的本质也是数字 将数字映射到字符就叫编码
- 将一个字符集映射到数字 就是给这个字符集编码 编码是有标准的 所有的计算机系统按照同一个编码标准执行
- 有时候编码和字符集会混用
编码和字符集介绍
常用的字符集简介
- ASCII码 ASCII表
- Unicode包含世界上所有常用字符,编码也有几种,包括UTF-8(8-bit Unicode Transformation Format)(//是用的最多的编码),UTF-16等
- Unicode,GBK等所有常用的字符集 都会兼容ASCII。例如:字符A在这些所有常用的字符集里,都是对应数字65
Java中的字符集
- Java中用的是UTF-16编码的Unicode
- UTF-16用16个bit,即两个byte,这也是char占用两个bit的原因。当把char转成数字的时候,需要用int
ASCII码和转义符(escape character)
如何输出特殊字符
- ASCII码+char,通过ASCII表可以找到需要的字符对应的数字,将这个数字转换为char 然后输出这个char
- 转义符。用来给字符赋值 也可以用在字符串里面 作为字符串中的一个字符转义符。用来给字符赋值 也可以用在字符串里面 作为字符串中的一个字符
转义符语法和常用的转义符
- \n,换行符
- ",双引号
- \t,制表符
- \uXXXX,Unicode编码对应的字符
字符串的“加法(就是字符串的拼接)”
1.将变量穿插在字符串中输出
- 字符串可以和任何类型进行加法运算 则会将这个值的字符拼接到字符串上
- 字符串也可以使用+=操作符来拼接
- 字符串的加法运算符符合加法运算符本身的优先级
2.字符串不是Java中的基本数据类型 - 字符串类型的名字叫做String
- 虽然String不是Java中的基础类型 但是也可以使用类似的语法String str=“abc”;来创建。开始的时候将其当成基础类型更容易理解
- String不是Java中的保留字
3.String的加法不会改变原String变量的值 改变其值要用赋值语句