在java中使用TreeMap进行中文排序

版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明
http://onbus.blogbus.com/logs/11628621.html


最近遇到需要按一个model中不同的列进行排序的问题,查了一下JDK API文档,发现,java中可以排序的工具类和接口共有五个SortedMap 、SortedSet、TreeMap 、TreeSet和Collections,由于我要排序的是一系列model,所以,最后使用了TreeMap对象,而且TreeMap到最后的处理比较自由,可以直接返回TreeMap对象,也可以返回model的一个Collection对象。其它几个类的用法其实都是大同小异,如果java基础较好,看一下API文档很容易明白,只是Collection中需要显式调用sort()方法而已。

      

       写理论的东西或者深入的东西就会太多了,而且让人会看得比较烦,这里讲求实用,就不多说了,直接入正体,基本的排序代码如下:

      

       /***************************

       * 类名:TestSort.java

       * 作者:啊       ***************************/

package ChineseSort;

import java.util.Collection;

import java.util.Iterator;

import java.util.SortedMap;

import java.util.TreeMap;

 

/**

 * @author  

 *

 */

public class TestSort {

 /**

 * @param args

 */

public static void main(String[] args) {

    // TODO Auto-generated method stub    

    TreeMap map = new TreeMap();      

        for(int i=0; i<10; i++) {

        String  s = ""+(int)(Math.random()*1000);

        map.put(s,s);

    }

    map.put("abcd","abcd");

    map.put("Abc", "Abc");

    map.put("bbb","bbb");

    map.put("BBBB", "BBBB");

    map.put("北京","北京");

    map.put("中国","中国");

    map.put("上海", "上海");

    map.put("厦门", "厦门");

    map.put("香港", "香港");

    map.put("碑海", "碑海");

    Collection col = map.values();

    Iterator it = col.iterator();

    while(it.hasNext()) {

        System.out.println(it.next());

    }

}

}


        代码就不多作解释了,一看就明白,开始放进去10个整数随机数,然后是英文,然后是中文。运行结果如下:

132

205

287

295

399

410

411

464

670

73

Abc

BBBB

abcd

bbb

上海

中国

北京

厦门

碑海

香港

       注意,这里的数字排序正常,而英文排序是区分大小写的,这个也是正常的,因为ASCII码中小写字母比大写字母靠后,中文排序则明显的不正确,碑和北明显应该在一起的,而且应该在最前面。这个主要是java中使用中文编码GB2312或者JBK时,char型转换成int型得过程出现了比较大的偏差,很多文章介绍过了,大家可以去网上找一下,这里不多说了,直接寻找解决方案。

        Java中之所以出现偏差,主要是compare方法的问题,所以这里自己实现Comparator接口,而国际化的问题,使用Collator类来解决。这里先解决中文问题,代码如下:

        /**********************************

       * 类名:CollatorComparator.java

       * 作者:啊       **********************************/

package ChineseSort;

 import java.text.CollationKey;

import java.text.Collator;

import java.util.Comparator;

 

/**

 * @author

 *

 */

public class CollatorComparator implements Comparator {

Collator collator = Collator.getInstance();

 public int compare(Object element1, Object element2) {

    CollationKey key1 = collator.getCollationKey(element1.toString());

    CollationKey key2 = collator.getCollationKey(element2.toString());

    return key1.compareTo(key2);

}

}


        同时修改我们前面完成的TestSort类,找到

        TreeMap map = new TreeMap();

        修改为

    CollatorComparator comparator = new CollatorComparator();

    TreeMap map = new TreeMap(comparator);

     再次运行该类,运行结果如下:

325

62

653

72

730

757

874

895

909

921

Abc

abcd

bbb

BBBB

碑海

北京

上海

厦门

香港

中国

        此时可以看到中文的排序已经完成正常。如果想不让英文区分大小写,则修改CollatorComparator类,找到

     element1.toString()

     修改为:

     element1.toString().toLowerCase()

     当然你改成转换成大写的也无所谓了,当然element2.toString()也要同时修改为element2.toString().toLowerCase()。再次运行结果如下:

 

207

353

656

659

770

789

857

861

931

984

Abc

abcd

bbb

BBBB

碑海

北京

上海

厦门

香港

中国

     现在可以看到,排序已经完全符合我们的要求了。如果要反向排序也很容易,遍历的时候倒过来,或者你写两个Comparator的实现类,正向的排序就像我们前面所写的,反向排序就将return key1.compareTo(key2);修改成return -key1.compareTo(key2);,加了个负号,这里你可以直接加个符号看看效果,结果我就不写了,肯定中国是Number One。我还真没找到TreeMap里直接反向的方法,谁看到了告诉我。