最近遇到一个问题,是有一个SQL数据库的表用varchar存中文数据。在使用SQL Migration wizard迁移到Azure后,所有的中文都变成????了。但如果源表是nvarchar类型,则没有问题。
经过分析后,发现该问题的出现跟OS的文本编码有关。
首先,采用varchar存放中文数据并不推荐。SQL server存放varchar数据时,对英文采用1个字节存储,对其他语言采用2个字节存储。而且,存储其他语言(如中文)时,其编码方式是随意的。用户可以输入任何编码方式的字符进入该字段。而SQL server只是在数据库一级通过collation这个属性来标识数据库的语言信息。本例的collation是Chinese_RPC_CI_AS
如果用户写入数据时采用的编码和读出时采用的编码不同,就会导致乱码。因此,建议的方式是采用nvarchar来存储中文数据。nvarchar和varchar的区别是,其编码方式固定采用unicode. 这样就避免了编码不一致的问题
但是,如果已有数据库已经采用了varchar,又不想转换为nvarchar,该怎么办呢?我们在使用SQL database migration wizard时需要注意几个地方:
1. 运行SQL database migrat