关闭

开发中编码知识储备

标签: 编码utf-8
124人阅读 评论(0) 收藏 举报
分类:

UTF-8

  • Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。
  • Unicode定义了大到足以代表人类所有可读字符的字符集。
    Java语言就用到了Unicode编码,从而实现了该语言的国际通用性。
  • Unicode用数字0-0x10FFFF来映射这些字符,最多可以容纳1114112个字符,或者说有1114112个码位。码位就是可以分配给字符的数字。UTF-8、UTF-16、UTF-32都是将数字转换到程序数据的编码方案。
  • 以\u开头的字符串一般是Unicode码表示,例如“中国”的unicode码为\u4e2d\u56fd
1
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:24341次
    • 积分:409
    • 等级:
    • 排名:千里之外
    • 原创:19篇
    • 转载:6篇
    • 译文:0篇
    • 评论:5条
    文章分类
    最新评论