java 英文字符串排序_英文字符串排序算法

最新推荐文章于 2024-08-30 15:28:52 发布

张溪梦 Simon

最新推荐文章于 2024-08-30 15:28:52 发布

阅读量1.8k

点赞数

文章标签： java 英文字符串排序

本文链接：https://blog.csdn.net/weixin_28850485/article/details/114628963

版权

编程工作偶尔会遇到一些不常见问题需要处理，学编程处理问题也难免需要熟悉一些算法

以前学习的时候就遇到过一个看似简单的排序算法问题，当时的解决办法是我没有用过的，在此记录一下''

问题 - 英文字符串排序

如下几个英文单词或者字母

apple，car， a，family，sky，application，app，baby，back，background，bad，bbbbb，bee，cafe ，cake，care

排序后的结果是

/**

app

apple

application

baby

back

background

bad

bbbbb

bee

cafe

cake

car

care

family

sky

**/

规则逻辑

通过结果可知

a 与 app a排前面 (开头字母相同，短的排在前面)

back 与 backgroud back排在前面 (开头字母相同，短的排在前面)

application 与 baby application 排在前面(开头字母不同，从a-z依次排序)

设计实现

a=1 b=2 c=3 d=4 e=5 f=6 g=7 h=8 i=9 j=10

k=11 l=12 m=13 n=14 o=15 p=16 q=17 r=18 s=19 t=20

u=21 v=22 w=23 x=24 y=25 z=26

a代表的是 1

b代表的是 2

z 代表 26 就可以实现初步排序

但是 bbbbb与 bee 两个单词要实现 bee 在前，逻辑该怎么写呢

起初想法是，字母依次比较，bbbbb 与 bee比较的第二个字母的时候， b 与 e 分别代表 2 和 5 所以bbbbb排前面，问题是一个一个字母比较看起来很麻烦，10个单词，10个都要比较

有以下解决方案，都有用到递归

方法一通过单词获取权重进行排序(当初使用方法)

bbbbb => b =2 b=2 b=2 b=2 b=2

bee => b = 2 e =5 e = 5

权重数 Px

Px(bbbbb) = 2 + 2 * 27^-1 + 2 * 27^-2 + 2 * 27^-3 + 2 * 27^-4 = 2.079

Px(bee) = 2 + 5 * 27^-1 + 5 * 27^-2 = 2.192

通过这个计算方式可以获得权重值

Px(bbbbb) < Px(bee)

所以 bbbbb 排在 baby 前面

权重数27

这里为什么是 27 不是26 是考虑到一种情况，会导致排序失败

比如 az 与 b比较

Px(az) = 1 + 26 * 26^-1 = 2

Px(b) = 2

Px(az) = Px(b) 显然是错的将26 改为 27 就可避免这个错误

优点

不管是任何单词，一千个也好，得出每个字符串对应的权重值，就能做到排序

代码实现

更新与2020-01-09，后面做了优化，区分字母大小写，权重改为53

public static void main(String[] args) {

String[] noP = {"Baby","apple", "car", "A", "family", "B","b", "Sky", "application", "app", "baby", "back", "background",

"bad", "bbbbb", "bee", "cafe", "cake", "care" };

String[] nopTop = sortByWeights(noP);

for (String string : nopTop) {

System.out.print(string + ",");

}

System.out.println();

System.out.println("----------------------");

for (String string : nopTop) {

System.out.println("weights:\t" + getStrWeights(string,0) + "\t" + string);

}

/**

* for 权重排序

public static String[] sortByWeights(String[] disorder) {

double[] weightsArr = new double[disorder.length];

HashMap recordMap = new HashMap<>();

// 计算每个字符串的权重值

for (int i=0; i

weightsArr[i] = getStrWeights(disorder[i],0);

recordMap.put(weightsArr[i],i);//保存权重值对应的字符串所在数组位置

}

// 将获取的权重值排序

Arrays.sort(weightsArr);

String[] sorderStr = new String[disorder.length];

int orderIndex = 0;

for (int i=0; i

// 拿出排好序的索引

orderIndex = recordMap.get(weightsArr[i]);

sorderStr[i] = disorder[orderIndex];

}

return sorderStr;

}

// 权重数值

private final static double weightsNum = 53;

/**

* for 计算字符串的权重值算法

* @param deep

* @param str

* @return weights

public static double getStrWeights(String str,int deep) {

int c = str.charAt(deep);

boolean isUppercase = true;

if(c >= 97) {

c = c - 32;

isUppercase = false;

}

c = c - 64; // A,a -> 1; B,b -> 2

int molecular = c*2;

if(isUppercase) molecular--; //if(B) -> 3;if(b) -> 4; for end [Baby,baby]

// 这里考虑了大小写如果字母是B 权重=3/53 小写b 权重=4/53 使小大小写也能排序

double weights = molecular/ (Math.pow(weightsNum, deep));

return ++deep >= str.length() ? weights : weights + getStrWeights(str,deep); //递归到字符串末尾

}

运行main方法，控制台输出结果

A,app,apple,application,B,Baby,b,baby,back,background,bad,bbbbb,bee,cafe,cake,car,care,family,Sky,

----------------------

weights:1.0A

weights:2.6151655393378426app

weights:2.615328013590046apple

weights:2.615329041941876application

weights:3.0B

weights:3.0394956910738395Baby

weights:4.0b

weights:4.0394956910738395baby

weights:4.040019613506452back

weights:4.0400214752701284background

weights:4.0405838376646495bad

weights:4.076923067174232bbbbb

weights:4.192239231043076bee

weights:6.042075001511314cafe

weights:6.045634987271372cake

weights:6.050551797792809car

weights:6.050618967335452care

weights:12.047115878410484family

weights:37.43289426842293Sky

缺点

考虑到前一种算法的计算，如果单词长度超过20或者更长，会导致计算量很大的问题

如果有一百个单词，比较计算很有必要，如果只有两个单词

bbbbbbbbbbbbbbbb 与 bar 比较用权重法不合适，因为只有两个单词没比较计算这么多，就能得出排序结论，下面就讲讲另一种排序算法

方法二逐个字母计算排序

下面说一下新思路，逐个比较

apple，car， a，family，sky，application，app，baby，back，background，bad，bbbbb，bee，cafe ，cake，care

还是上面的单词

首先获取每个字符串的第一个字母

第一个字母为 a 的全部取出

apple a application app

比较他们的第二个字母 a 没有第二个字母，自然排在最前面，依次类推，使用递归即可完成排序

因为临时想到的一种排序方法，用到了TreeSet HashMap ArrayList 工具类，感觉还可以后期优化。

代码如下：

package javabasis.algorithm;

import java.util.ArrayList;

import java.util.List;

import java.util.Set;

import java.util.TreeMap;

/**

* 字段排序算法

* @author Narule

public class StringAlgorithm {

/**

* 逐个字母比较排序

* @param disorder

* @return orderly

public static String[] nopTop(String[] disorder) {

int index = 0;

int end = disorder.length;

String[] orderly = new String[end]; // 新建排序后的数组

TreeMap> treeMap = new TreeMap<>(); // 排序工具类，key是按照大小排序的

List list = null;

// 收集字符串首字母信息

for (String str : disorder) {

char cTag = str.charAt(0);

list = treeMap.get(cTag);

if (list == null) {

list = new ArrayList<>(1);

}

list.add(str);

treeMap.put(cTag, list);

}

// 通过收集的首字母信息给字符串排序

Set keySet = treeMap.keySet();

for (char cTag : keySet) {

list = treeMap.get(cTag);

if (list != null && list.size() > 0) {

if (list.size() < 2) { // 如果只有一个字符串，不需要递归

for (String string : list) {

orderly[index] = string;

index++;

}

} else { // 如果有两个以上字符串，开头字母相同，可能需要递归排序

ArrayList arrayList = new ArrayList<>(0);

for (String string : list) {

if (string.length() > 1) { // 字符串长度大于2的，需要添加到list,准备下一次递归排序用到

arrayList.add(string.substring(1));

} else {

orderly[index] = string;

index++;

}

if (arrayList.size() > 1) {

String[] array = new String[arrayList.size()];

int i = 0;

for (String string : arrayList) {

array[i] = string;

i++;

}

array = nopTop(array); // 还需要递归排序 back background -> ack ackground

for (String string : array) {

orderly[index] = cTag + string;

index++;

}

} else if (arrayList.size() == 1) {

orderly[index] = cTag + arrayList.get(0);

index++;

}

treeMap.clear();

return orderly; // 排序后的字符串数组

}

public static void main(String[] args) {

String[] noP = { "apple", "car", "a", "family", "sky", "application", "app", "baby", "back", "background",

"bad", "bbbbb", "bee", "cafe", "cake", "care" };

String[] nopTop = nopTop(noP);

for (String string : nopTop) {

System.out.println(string);

}

此方法用到TreeMap,这是Java工具类，自带排序效果，对此有疑问可以查看java源代码，或介绍文档

优点

没有很大的计算量

缺点

使用TreeMap ArrayList 对象，递归过多也会出现内存损耗过大或者溢出的情况

未完，后期待优化

张溪梦 Simon

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫