oracle中文(utf8)按拼音排序的简单解决方案

在中文应用管理系统里,utf8格式取代gb2312数据库存储越来越多的被设置成默认格式,这种国际化的编码格式在解决文本格式兼容性方面带来了很大的好处。 但是UTF8使用用3个字节表示1个汉字,在编码上没有考虑拼音排序,所以在使用UTF8的ORACLE数据库中直接使用order by进行排序是不行的;GB2312按汉字使用频率把汉字分为一级和二级. 内码的排列次序, 先一级(3755个)再二级(3008个), 一级是按照拼音, 二级按照笔划,所以对于一级汉字是可以直接使用“order by”进行编码的,而且一级汉字包含了最常用的3755个汉字,故而在数据库中选择直接的“order by”虽然不能对所有汉字实现正确的排序,但是还是非常有效的。

解决思路:把UTF8编码转变成GB2312即可实现对高频词的排序。  select cpname from USER_INFORMATION order by convert(cpname,'ZHS16CGB231280','UTF8') desc

转载 来自:http://blog.csdn.net/treeqian/article/details/2623729

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值