如上图所以,是utf-8表示了的世界上所有的字符,左边是十六进制表示,右边是二进制表示,比如第三行1110xxxx 10xxxxxx 10xxxxxx
(汉字主要落在第三第四行),表示这个范围的汉字用三个字节表示,第一个字节就是1110xxxx(于是lex中的换成十六进制的表示就是:[/xe0-/xef][/x80-/xbf]{2}),嗯,就是这样,很要好理解了把~
如上图所以,是utf-8表示了的世界上所有的字符,左边是十六进制表示,右边是二进制表示,比如第三行1110xxxx 10xxxxxx 10xxxxxx
(汉字主要落在第三第四行),表示这个范围的汉字用三个字节表示,第一个字节就是1110xxxx(于是lex中的换成十六进制的表示就是:[/xe0-/xef][/x80-/xbf]{2}),嗯,就是这样,很要好理解了把~