java实现文件单词频率统计

该博客介绍了一种使用Java统计文件中单词频率的方法。通过读取文件内容,使用split()函数分割单词,并存储到Map中进行计数。然后利用TreeSet对Map排序,展示出现频率最高的单词。
摘要由CSDN通过智能技术生成

 思路:

1、将文件内容存入StringBuffer中。

2、利用split()函数分割字符串,可按(“,”,“.”,“!”,“空格”,“回车”)分割,得到一个数组。

3、遍历数组,将其放入一个Map <String,Integer>中,key=单词,value=单词出现的次数。

4、如要求出文件中出现频率最高的几个单词,则要对Map进行排序。

-----------------------------------------------------------------------------------------------------------------------------------------

以下是实现一个文件中出现频率最高的单词的统计

FileWordCount.java主函数所在文件

import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.*;

/**
 * Created by IntelliJ IDEA.
 * User: FLY
 * Date: 11-9-13
 * Time: 下午3:59
 * To change this template use File | Settings | File Templates.
 */
public class FileWordCount {
    public static void main(String[] args) {
        try {
            BufferedReader br = new BufferedReader(new FileReader("D:\\test.txt"));
            String s;
            StringBuffer sb = new StringBuffer();
            while ((s = br.readLine()) != null) {

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值