统计单词频率(HashMap)

统计单词的要求很大程度上取决于速度,使用Hash毋庸置疑是目前非常快的(应该是最快的吧)以前我在数据结构课程设计的时候是自己写的Hash函数,呵呵,虽然哪肯定比一般的数组要快的多,但感觉不咋的,最近做编译技术的课程设计,了解到Java中提供一个非常棒的HashMap函数,只需要一步就可以统计单词的频率,现在我来介绍一下:

import java.util.HashMap;

 

public class WordMap {

 

    public static void main(String[] args) {

       String input = "a1,b2,3c,d4d,a1,b2,a1";

       String[] ws = input.split(",");

//做的单词分割,

//如果你要空格分割 String[] ws = input.split(" ");

       HashMap<String,Integer> hm = new HashMap<String, Integer>();

//初始化HashMap

       for(String s:ws)

       {

           if(s.matches("[a-zA-Z]//w+"))

//这里是一个正则表达式,判断的是第一个必须是字母,后面的是一个字母或多个字母,一个//数字或多个数字

           {

              Integer cou = hm.get(s);

//get()方法将产生一个与键相关联的Integer值,然后这个值被递增,为的是记录标识符的//个数

              hm.put(s, cou == null?1:cou+1);

//保存到HashMap中以单词做key,判断单词是否为空,空为1,或则加1

           }

       }

       System.out.println(hm);

//打印HashMap

    }

}

 

 

执行结果:

{a1=3, b2=2, d4d=1}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值