JavaIO流——流标记类 StreamTokenizer

最新推荐文章于 2024-03-15 09:20:25 发布

Casey-新

最新推荐文章于 2024-03-15 09:20:25 发布

阅读量706

点赞数 1

分类专栏：笔记文章标签： java

本文链接：https://blog.csdn.net/casey_xiaoxin/article/details/107009385

版权

本文介绍了Java中的StreamTokenizer流标记类，分析了它相对于传统FileReader的优势，如避免内存中存储字符，提高效率。通过示例展示了如何使用StreamTokenizer逐个标记字符，统计文件中字符出现频率，并提供了如何处理特殊字符的方法。

摘要由CSDN通过智能技术生成

StreamTokenizer 流标记类

问题描述：

一篇英文文件中的内容，输出其各个字符，并统计出现频率最高的字符，以及出现的次数

优点：

选择StreamTokenize 对比传统 FileReader的方法的优点有哪些？

1.传统方法会在系统内存中分配空间通过FileReader读取字符到内存中去，然后再存入到字符数组
导致过程比较繁琐效率低
2.StreamTokenize类不会把读取的字符存入内存中去，而是直接标记该内容的每个字符，没有了系统内存中间商赚取差价
自然也就效率高了

分析：

通过StreamTokenizer 类依次标记每一个字符
调用nextToken()方法读取下一个标记
StreamTokenizer对象.sval 获取标记为字符串类型的值
并把获取的值放入TreeMap集合中 key 为字符，value 为该字符出现的次数

首先看一下这个文件
在这里插入图片描述

继续分析：

1.该文件内容中有 “句号” ，“单引号”，可以用ordinaryChar() 方法将其设置为普通字符
这样StreamTokenizer在获取值的时候就不会获取这些特殊符号

好了下面直接上代码

/*
	 * 统计一篇英文字符串 各个单词出现的次数 
	 * 
	 * 利用 流标记类 StreamTokenizer 优点:不会占用系统内存
	 */
	public static void main(String[] args) {
   

		// 创建字符输入流
		try (FileReader fr = new FileReader("e:/Shakespeare.txt")) {
   

			// 创建流标记类 ， 对传入的字符输入流的文本内容 进行标记化处理
			StreamTokenizer tokenizer = new