特殊字符
> >
< <
& &
" "
' '
实例:
1.<record time="3分28秒">
2.<record time="3'28"">
3.<record time="3'28"">
4.<record time='3'28"">
Unicode——世界上所有文字的编码
www.unicode.org
ISO10646UCS
16位编码 66536
UTF-8、UTF-16
XMl规定所有的Parser必须支持UTF-8/UTF-16
0x00-0xFF = iso-8859-1
Unihan(统汉字——中日韩文字)
1Unit=2Bytes
Unicode之UTF-8
汉字位于第三部分
Office内码、java...
UTF-8网络传送、字数计算
特点:
1.汉字膨胀
2.西文不变