unicode vs utf-8

前提:
    是不是感觉到unicode和utf-8是一个东西?因为两者都以u开头。


UTF-8和Unicode是两个完全不同的事物。

Unicode:
    Unicode是一种字符集。
    第一个原因是,计算机只认数字,即010101,所以,需要把文字表示成数字得有个标准来遵守。第二个原因是,很早的时候,计算机是在美国发明的,所以,支持英文是理所当然的事情。英文有26个字母,算上大小写,加上标点和数字,就大概有少于100个。所以,用1-100个数字就可以表示了,后来照顾到欧洲人民,比如法语,德语什么的,也不超过250个。但是,如果欧美以外的国家,加上汉字,加上阿拉伯文,加上日韩文字,这么多的文字就用unicode来编码了,uni在英文中表示巨大的,统一的,比如universe,综合性大学 blah blah blah,unicode的位很多,其实我现在也不知道,总之,用unicode这个标准来表示世界上的文字,足够了,就类似于ipv4升级为ipv6一样。

UTF-8

    UTF-8是一种编码方式,是把数字转换为二进制存储起来的算法。当然也可以从二进制转化回来为一串数字。当应用程序读取0101001这样的二进制数字的时候,utf-8就把这二进制转化为实际的数字,然后利用unicode 字符集,把对应的数字转化为字符,然后显示出来。


所以,
    unicode和utf-8是两种不同的事物,不可以进行比较。虽然样子类似,但是确实不同的东西,需要重新认识。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/29757574/viewspace-2152699/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/29757574/viewspace-2152699/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值