java计算字符串中字符出现的次数,关于java:计算字符串中字符出现次数的简单方法...

本问题已经有最佳答案,请猛点这里访问。

有没有一种简单的方法(而不是手动遍历所有的字符串,或循环遍历indexOf),以便找到一个字符出现在字符串中的次数?

假设我们有"abdsd3 $ asda $ asasdd $ sadas",我们希望$出现3次。

public int countChar(String str, char c)

{

int count = 0;

for(int i=0; i < str.length(); i++)

{    if(str.charAt(i) == c)

count++;

}

return count;

}

这绝对是最快的方式。这里的正则表达式要慢很多,而且可能更难理解。

哦,你不介意使用增强的for循环而不是C风格的索引吗?

我不想使用隐式迭代器。

首先,使用迭代器肯定没有羞耻,问题是什么?其次,迭代器不用于循环数组,例如,请参阅stackoverflow.com/a/7956673/1828937。

@DmitryGinzburg:问题是我们这里没有char数组,而是String。另一种方法是迭代s.toCharArray(),但这将涉及Strings内部char数组的副本。

但是,如果我们必须在字符串中找到每个字符的出现怎么办?

功能风格(Java 8,只是为了好玩):

str.chars().filter(num -> num == '$').count()

哇超级喜欢!

不是最佳的,但计算出现次数的简单方法:

String s ="...";

int counter = s.split("\\$", -1).length - 1;

注意:

美元符号是一个特殊的正则表达式符号,因此必须使用反斜杠进行转义。

反斜杠是转义字符(如换行符)的特殊符号,因此必须使用反斜杠进行转义。

split的第二个参数可防止删除空尾随字符串。

几乎是个好主意。但是在一些简单的情况下失败了。例如s ="$"

不起作用,因为$是一个正则表达式元字符。

我在答案中纠正了元字符问题。

这仍然不适用于尾随"$",例如"abdsd3 $ asda $ asasdd $ sadas $",因为默认情况下会忽略空尾随项目。它应该是int counter = s.split("\$", -1).length - 1;

"\$"应替换为"\\$",因为反斜杠已经具有字符串本身唯一的特殊含义,例如换行符,制表符等。(转义字符)因此需要双反斜杠。

它不适用于最后一个字符搜索ex:"356595".split("5") - > size = 3"356559".split("5") - > size = 4

您可以使用Apache Commons'StringUtils.countMatches(String string, String subStringToCount)。

我总是喜欢apache commons

既然你正在扫描整个字符串,你可以建立一个完整的字符数并进行任意数量的查找,所有这些都是相同的大成本(n):

public static Map getCharFreq(String s) {

Map charFreq = new HashMap();

if (s != null) {

for (Character c : s.toCharArray()) {

Integer count = charFreq.get(c);

int newCount = (count==null ? 1 : count+1);

charFreq.put(c, newCount);

}

}

return charFreq;

}

// ...

String s ="abdsd3$asda$asasdd$sadas";

Map counts = getCharFreq(s);

counts.get('$'); // => 3

counts.get('a'); // => 7

counts.get('s'); // => 6

这是最好的方法:)

字符频率计数是某些应用程序(例如教育)的常见任务,但不足以保证包含在核心Java API中。因此,您可能需要编写自己的函数。

没有正则表达式的东西有点功能:

public static int count(String s, char c) {

return s.length()==0 ? 0 : (s.charAt(0)==c ? 1 : 0) + count(s.substring(1),c);

}

为了清楚起见,它不是尾递归的。

你也可以为每个循环使用a。我觉得阅读起来比较简单。

int occurrences = 0;

for(char c : yourString.toCharArray()){

if(c == '$'){

occurrences++;

}

}

我相信你期望得到的"单线"是:

"abdsd3$asda$asasdd$sadas".replaceAll("[^$]*($)?","$1" ).length();

请记住,要求是:

(instead of traversing manually all the string, or loop for indexOf)

让我补充一点:这个问题的核心听起来似乎不需要"任何循环",也没有速度要求。我相信这个问题的潜台词是冷静因素。

雅虎我投了票!我的第一篇文章:-D

@Marcelo解决方案看起来不错但失败了:"$$$$$$$$".split("\\$").length - 1 = -1或"$$$$$$$$".split("$").length - 1 = 0。

那么有很多不同的实用程序,例如Apache Commons Lang String Utils

但最后,它必须循??环遍历字符串以按照这种或那种方式计算事件。

另请注意,上面的countMatches方法具有以下签名,因此也适用于子字符串。

public static int countMatches(String str, String sub)

这个来源是(从这里):

public static int countMatches(String str, String sub) {

if (isEmpty(str) || isEmpty(sub)) {

return 0;

}

int count = 0;

int idx = 0;

while ((idx = str.indexOf(sub, idx)) != -1) {

count++;

idx += sub.length();

}

return count;

}

我很好奇,如果他们迭代字符串或使用正则表达式。

遍历字符串可能是最有效的,但使用Regex执行此操作可能会产生更清晰的代码(尽管您始终可以在函数中隐藏遍历代码)。

正则表达式=清洁?可能更短,但我认为与基本循环代码相比,正则表达式通常非常神秘(而且不太干净)。

这是简单的代码,但当然有点慢。

String s = ...;

int countDollar = s.length()-s.replaceAll("\\$","").length();

int counta = s.length()-s.replaceAll("a","").length();

在一个重复的问题中,更好的答案就在这里

还有另一种方法可以计算每个字符串中的字符数。

假设我们有一个String作为

String str ="abfdvdvdfv"

然后,我们可以通过仅遍历一次来计算每个字符出现的次数

for (int i = 0; i < str.length(); i++)

{

if(null==map.get(str.charAt(i)+""))

{

map.put(str.charAt(i)+"", new Integer(1));

}

else

{

Integer count = map.get(str.charAt(i)+"");

map.put(str.charAt(i)+"", count+1);

}

}

然后我们可以通过遍历Map来检查输出

for (Map.Entry entry:map.entrySet())

{

System.out.println(entry.getKey()+" count is :"+entry.getValue())

}

这是不必要的复杂,您可以只使用一个数组(如果只使用基本字符,则为256长,或者对于整个范围的java支持,为65535长)。做一些像array[str.charAt(i)]++而不是if / else分支,然后在输出上,只需执行for(int i = 0; i < length; ++i) if(array[i] != 0) System.out.println((char)i +" =" + array[i])。

您可以查看对字符串进行排序 - 将其视为char数组 - 然后执行修改后的二进制搜索来计算出现次数?但我同意@tofutim认为遍历它是最有效的 - O(N)与O(N * logN)+ O(logN)

public static int countChars(String input,char find){

if(input.indexOf(find) != -1){

return  countChars(input.substring(0, input.indexOf(find)), find)+

countChars(input.substring(input.indexOf(find)+1),find) + 1;

}

else {

return 0;

}

}

这有效,但它令人困惑且过于复杂。为什么使用递归 - 更不用说这个复杂的实现 - 什么时候可以简单而干净地使用迭代?此外,indexOf找到目标字符串的最左侧索引,因此countChars(input.substring(0, input.indexOf(find)), find)将始终等于零;你可以废弃返回表达式的第一行并获得相同的结果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值