获取每个单词出现的频率

原创 2016年06月01日 09:21:39
package play;

import java.util.HashMap;
import java.util.Map;
import java.util.Map.Entry;

public class 每个单词出现的频率 {
	public static void main(String[] args) {
		String s = "Welcome to ADempiere, a commons-based peer-production of Open Source ERP Applications. This Wiki is for the global community to contribute and share know-how and domain expertise. We hope you can find as much open information and participate in making it most usable for everyone. This project has a bazaar of Citizens with a Community Council Team which work in theFunctional Team and Technical Team along the Software Development Procedure supported and funded by the foundation ADempiere e.V..";
		String s_sub = s.replace(", ", " ").replace(". ", " ");//删除符号,单词之间用空格间隔
		String sArr[] = s_sub.split(" ");//只要能把需要分割的东西分割成数组就行了,按实际情况处理
		Map<String, Integer> m = new HashMap<String, Integer>();
		for (int i = 0; i < sArr.length; i++) {
			String danCi = sArr[i];
			if (m.get(danCi) == null) {
				m.put(danCi, 1);
			}
			else {
				m.put(danCi, m.get(danCi) + 1);
			}
		}
		for (Entry<String, Integer> entry : m.entrySet()) {
			System.out.println(entry.getKey() + "\t次数" + entry.getValue());
		}
	}
}
以上。
版权声明:本文为博主原创文章,未经博主允许不得转载。

用python统计文本里的单词出现次数最多的10个

python入门教程至此已学习完毕,下面是结业脚本:(一部分是书里的源码,一部分是自己加的练习题) #写一个文本统计的脚本:计算并打印有关文本文件的统计数据,包括文件里包含多少个字符、行、单词数,以...
  • dengzi2009
  • dengzi2009
  • 2015年09月05日 22:31
  • 5020

写一个程序,分析一个文本文件(英文文章)中各个单词出现的频率,并且把频率最高的10词打印出来

写一个程序,分析一个文本文件(英文文章)中各个单词出现的频率,并且把频率最高的10词打印出来   在看到这个问题的时候,我决定用c语言来进行编写,并且将这个问题进行了分解. ...
  • u011680118
  • u011680118
  • 2015年04月03日 09:46
  • 1434

统计英文文件中单词数和各单词出现的频率(次数)

/* File name:词频统计.cpp Author:杨柳 Date:2017.3.25 IDE:DEV-c++ */ #include #include #include #define...
  • yangliu_w
  • yangliu_w
  • 2017年05月22日 21:20
  • 959

用java程序分析一个文本文件中各个词出现的频率,并把频率最高的十个单词打印出来(一般的冠词,虚词除外)

你的
  • kasabulan
  • kasabulan
  • 2014年10月05日 20:23
  • 1646

统计文件中每个单词的出现次数

统计文件中每个单次的出现次数是C语言经典案例之一,当然如果你对shell编程比较精通的话,也可以直接用shell语句统计出来。 本文阐述的是用C语言实现单词统计,应用的数据结构为二叉树,所以需要读者十...
  • wangyan_HBU
  • wangyan_HBU
  • 2016年02月18日 16:44
  • 1937

统计分析文章中英文单词出现次数及频率(C++实现)

设计思路: 1.为了统计数据具有实际意义: 统计中需要剔除一些无统计意义的词,例如 am is are 等虚词、代词、连词等。 一般的文章句首单词首字母为大写,此时需要将此类情况的大写字母转化为...
  • wise_x_y
  • wise_x_y
  • 2014年09月28日 13:05
  • 4135

shell实例浅谈之四查找文本中出现频率最高的单词

一、问题       判断一个文件是否是可执行文件,并且判断能否在系统PATH路径中找到。第一种情况:可执行且找到返回0,第二种情况没找到或者不可执行返回1,第三种情况可执行但没找到或没找到返回...
  • taiyang1987912
  • taiyang1987912
  • 2014年10月12日 10:43
  • 4443

利用python内置函数,快速统计单词在文本中出现的次数

python中包含许多标准编程数据结构,如list(列表),tuple(元组)、dict(字典)和set(),如果现有的数据类型不能满足需求,可以派生某个内置类型进行定制,或者使用collection...
  • Eddy_zheng
  • Eddy_zheng
  • 2015年08月07日 11:13
  • 13207

统计文章中单词的字数并按照出现的频率排序(treeSet)

基本思路:用hashmap存储key值为单词,value为单词出现的频率。 hashmap存储对单词的遍历 map的遍历存储在set中 排序 TreeSet 对wordEntity实现comparab...
  • Raynarong
  • Raynarong
  • 2016年03月30日 11:02
  • 526

给定一个file, 查找出里面出现频率最高的10个单词

之前已经总结了给定一组数字, 如何在线性时间内找到第k小的数字。 这两个问题看似有十分subtle的关系。 很显然这里是找最大的前K个单词。 单词相当于卫星数据, 直接对单词的键值, 即频率排序啦。 ...
  • a130737
  • a130737
  • 2015年03月24日 17:15
  • 1315
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:获取每个单词出现的频率
举报原因:
原因补充:

(最多只允许输入30个字)