在java中使用TreeMap进行中文排序

作者:Junsan Jin

 

日期: 2005-12-23

 

版本:1.0

 

信箱:junnef21@sohu.com
QQ334620162
MSN
junsanjin@hotmail.com

 

Bloghttp://blog.csdn.net/junnef

 

个人站点:http://www.isinfo.com.cn

 

声明:本人保留本文的所有权利。如需引用请保留此信息。

 

 

    最近工作遇到需要按一个model中不同的列进行排序的问题,查了一下JDK API文档,发现,java中可以排序的工具类和接口共有五个SortedMap SortedSetTreeMap TreeSetCollections,由于我要排序的是一系列model,所以,最后使用了TreeMap对象,而且TreeMap到最后的处理比较自由,可以直接返回TreeMap对象,也可以返回model的一个Collection对象。其它几个类的用法其实都是大同小异,如果java基础较好,看一下API文档很容易明白,只是Collection中需要显式调用sort()方法而已。

 

        

 

    写理论的东西或者深入的东西就会太多了,而且让人会看得比较烦,这里讲求实用,就不多说了,直接入正体,基本的排序代码如下:

 

        

 

       /***************************

 

       * 类名:TestSort.java

 

       * 作者:Junsan Jin 2005-12-23

 

       ***************************/
      
package ChineseSort;

 

 

import java.util.Collection;

 

import java.util.Iterator;

 

import java.util.SortedMap;

 

import java.util.TreeMap;

 

 

/**

 

 * @author www.inspiresky.com

 

 *

 

 */

 

public class TestSort {

 

 

/**

 

 * @param args

 

 */

 

public static void main(String[] args) {

 

   // TODO Auto-generated method stub    

 

   TreeMap map = new TreeMap();     

 

    

 

   for(int i=0; i<10; i++) {

 

      String  s = ""+(int)(Math.random()*1000);

 

      map.put(s,s);

 

   }

 

    

 

   map.put("abcd","abcd");

 

   map.put("Abc", "Abc");

 

   map.put("bbb","bbb");

 

   map.put("BBBB", "BBBB");

 

    

 

   map.put("北京","北京");

 

   map.put("中国","中国");

 

   map.put("上海", "上海");

 

   map.put("厦门", "厦门");

 

   map.put("香港", "香港");

 

   map.put("碑海", "碑海");

 

    

 

   Collection col = map.values();

 

   Iterator it = col.iterator();

 

   while(it.hasNext()) {

 

      System.out.println(it.next());

 

   }

 

}

 

}

 

 

    代码就不多作解释了,一看就明白,开始放进去10个整数随机数,然后是英文,然后是中文。运行结果如下:

 

 

132

 

205

 

287

 

295

 

399

 

410

 

411

 

464

 

670

 

73

 

Abc

 

BBBB

 

abcd

 

bbb

 

上海

 

中国

 

北京

 

厦门

 

碑海

 

香港

 

    

 

   注意,这里的数字排序正常,而英文排序是区分大小写的,这个也是正常的,因为ASCII码中小写字母比大写字母靠后,中文排序则明显的不正确,碑和北明显应该在一起的,而且应该在最前面。这个主要是java中使用中文编码GB2312或者JBK时,char型转换成int型得过程出现了比较大的偏差,很多文章介绍过了,大家可以去网上找一下,这里不多说了,直接寻找解决方案。

 

 

       Java中之所以出现偏差,主要是compare方法的问题,所以这里自己实现Comparator接口,而国际化的问题,使用Collator类来解决。这里先解决中文问题,代码如下:

 

        

 

       /**********************************

 

       * 类名:CollatorComparator.java

 

       * 作者:Junsan Jin 2005-12-23

 

       **********************************/

 

package ChineseSort;

 

 

import java.text.CollationKey;

 

import java.text.Collator;

 

import java.util.Comparator;

 

 

/**

 

 * @author www.inspiresky.com

 

 *

 

 */

 

public class CollatorComparator implements Comparator {

 

Collator collator = Collator.getInstance();

 

 

public int compare(Object element1, Object element2) {

 

   CollationKey key1 = collator.getCollationKey(element1.toString());

 

   CollationKey key2 = collator.getCollationKey(element2.toString());

 

   return key1.compareTo(key2);

 

}

 

}

 

 

    同时修改我们前面完成的TestSort类,找到

 

    

 

   TreeMap map = new TreeMap();

 

    

 

   修改为

 

   CollatorComparator comparator = new CollatorComparator();

 

   TreeMap map = new TreeMap(comparator);

 

 

   再次运行该类,运行结果如下:

 

 

325

 

62

 

653

 

72

 

730

 

757

 

874

 

895

 

909

 

921

 

Abc

 

abcd

 

bbb

 

BBBB

 

碑海

 

北京

 

上海

 

厦门

 

香港

 

中国

 

 

    此时可以看到中文的排序已经完成正常。如果想不让英文区分大小写,则修改CollatorComparator类,找到

 

    

 

   element1.toString()

 

 

   修改为:

 

 

   element1.toString().toLowerCase()

 

 

   当然你改成转换成大写的也无所谓了,当然element2.toString()也要同时修改为element2.toString().toLowerCase()。再次运行结果如下:

 

 

207

 

353

 

656

 

659

 

770

 

789

 

857

 

861

 

931

 

984

 

Abc

 

abcd

 

bbb

 

BBBB

 

碑海

 

北京

 

上海

 

厦门

 

香港

 

中国

 

 

   现在可以看到,排序已经完全符合我们的要求了。如果要反向排序也很容易,遍历的时候倒过来,或者你写两个Comparator的实现类,正向的排序就像我们前面所写的,反向排序就将return key1.compareTo(key2);修改成return -key1.compareTo(key2);,加了个负号,这里你可以直接加个符号看看效果,结果我就不写了,肯定中国是Number One。我还真没找到TreeMap里直接反向的方法,谁看到了告诉我。

 

 

   最后一些要说明的,这里我就不再写实现的代码了,就是我们要实现的是根据model中的一个列进行排序,而我们测试代码只是简单的一些值,这个容易,遍历所有model,把要排序的列值取出来作为TreeMapkey,然后model放进去作为value就行了,这个很简单,如果想写成稍微通用点的,就使用反射机制,把取值方法封装一下就行了,然后把model对象和方法名扔进去就行了。至于value值重复的问题,也好办,只要value相同只要不是多列同时作为排序的键,那么他们之间的前后顺序无所谓,判断一下当前Map中是否含有该key值,存在,则新的key做成value+longtime就行了,就是加个时间戳(感觉用时间戳比较方便,其它的能区分的办法也行啦)。至于多列的排序,其实也容易,按照列的前后顺序firstvalue+secondvalue+......组成key放到TreeMap里照样OK J 方便吧。有什么疑问可以去论坛找我,http://www.inspiresky.com/bbs,我随时提供解答。

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值