java 在一段英文文本中计算每个单词出现的次数

目前自己总结了以下方式:

1,将文本读出为一个字符串,使用indexof 和 substring 进行递归的搜索切割计算每次找到同一单词的次数,注意排重,每次查找新的单词时候,需要判断这个单词是否已经计算过出现的次数。

2,将文本的单词切割并维护到一个MAP中,已单词为KEY 对应的VALUE为这个单词出现的次数,然后启用多线程,结合方法1 进行 查找计算。

3.如果文本很大,达到了大数据的量级,可以使用hadoop+hafs等大数据处理框架 编写map+reduce程序进行处理,具体实现网上很多。

以上只是可实现的思路,具体实现可根据以上思路作为引子。

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
好的,以下是Java代码实现: ```java import java.util.*; public class WordCount { public static void main(String[] args) { // 输入文本内容 Scanner sc = new Scanner(System.in); System.out.println("请输入文本内容:"); String text = sc.nextLine(); // 将文本内容的标点符号替换为空格 text = text.replaceAll("[^a-zA-Z]", " "); // 将文本内容转换为小写字母 text = text.toLowerCase(); // 将文本内容按照空格分割成单词 String[] words = text.split("\\s+"); // 使用HashMap统计每个单词出现次数 Map<String, Integer> wordCountMap = new HashMap<>(); for (String word : words) { if (wordCountMap.containsKey(word)) { wordCountMap.put(word, wordCountMap.get(word) + 1); } else { wordCountMap.put(word, 1); } } // 将单词出现次数存入List List<Map.Entry<String, Integer>> wordCountList = new ArrayList<>(wordCountMap.entrySet()); // 对单词出现次数进行降序排列 Collections.sort(wordCountList, new Comparator<Map.Entry<String, Integer>>() { @Override public int compare(Map.Entry<String, Integer> o1, Map.Entry<String, Integer> o2) { return o2.getValue().compareTo(o1.getValue()); } }); // 输出每个单词及其出现次数 System.out.println("单词出现次数降序排列如下:"); for (Map.Entry<String, Integer> entry : wordCountList) { System.out.println(entry.getKey() + " : " + entry.getValue()); } } } ``` 运行程序后,输入要统计的文本内容,程序会输出每个单词及其出现次数的降序排列结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值