1、汉字在数据库中占几个字节
答:UTF-8 编码汉字占用2-4个字节,GBK编码汉字占用2个字节
解析
Unicode规则:将世界上所有的符号都纳入其中。每一个符号都给予一个独一无二的编码
UTF-8就是在互联网上使用最广的一种Unicode的实现方式。UTF-8是一种变长的编码方式。它使用1~6个字节表示一个符号,根据不同的符号而变化字节长度,目前只用到1-4个字节表示全世界100多万个字符。
UTF-8 编码:
占2个字节的汉字:〇
占3个字节的:基本等同于GBK,含21000多个汉字
占4个字节的:中日韩超大字符集里面的汉字,有5万多个
一个utf8数字或英文占1个字节
GBK编码: 一个汉字占2个字节,英文或数字占一个字节
总结:UTF-8 编码汉字占用2-4个字节,GBK编码汉字占用2个字