StreamTokenizer 流标记类
问题描述:
一篇英文文件中的内容,输出其各个字符,并统计出现频率最高的字符,以及出现的次数
优点:
选择StreamTokenize 对比传统 FileReader的方法的优点有哪些?
1.传统方法会在系统内存中分配空间 通过FileReader读取字符到内存中去,然后再存入到字符数组
导致过程比较繁琐效率低
2.StreamTokenize类 不会把读取的字符存入内存中去,而是直接标记该内容的每个字符,没有了系统内存中间商赚取差价
自然也就效率高了
分析:
- 通过StreamTokenizer 类依次标记每一个字符
- 调用nextToken()方法读取下一个标记
- StreamTokenizer对象.sval 获取标记为字符串类型的值
- 并把获取的值放入TreeMap集合中 key 为 字符 ,value 为 该字符出现的次数
首先看一下这个文件
继续分析:
1.该文件内容中有 “句号” ,“单引号”,可以用ordinaryChar() 方法将其设置为普通字符
这样StreamTokenizer在获取值的时候就不会获取这些特殊符号
好了下面直接上代码
/*
* 统计一篇英文字符串 各个单词出现的次数
*
* 利用 流标记类 StreamTokenizer 优点:不会占用系统内存
*/
public static void main(String[] args) {
// 创建字符输入流
try (FileReader fr = new FileReader("e:/Shakespeare.txt")) {
// 创建流标记类 , 对传入的字符输入流的文本内容 进行标记化处理
StreamTokenizer tokenizer = new