Java文本处理10-计算文本平均句长

最新推荐文章于 2024-06-17 20:34:59 发布

罗思洋

最新推荐文章于 2024-06-17 20:34:59 发布

阅读量2.4k

点赞数 2

分类专栏： Java 文章标签： Java

本文链接：https://blog.csdn.net/lsylsy726/article/details/87791169

版权

这篇博客介绍了如何在Java中计算文本的平均句长。首先，任务基于之前文本处理任务，利用InputStreamReader和BufferedReader读取utf-8编码的文本。接着，遍历文本，统计汉字数和包含句号、感叹号、问号的句子数。通过总汉字数除以总句子数得到平均句长。博主提供了代码示例，并展示了对简单文本和《西游记》的计算结果。

摘要由CSDN通过智能技术生成

1、任务简介

本节任务是计算文本平均句长，可以再上一节任务《Java文本处理9-计算文本句子数》的基础上来进行，并且还需要使用到《Java文本处理3-统计文本行数、字符数、汉字、数字、字母数等》里面关于计算文本总字数的相关方法。

2、基本任务和代码

1）具体思路

（1）首先需要使用InputStreamReader类和BufferedReader类实现文本的读取，由于我使用的文本文档均为utf-8编码，所以还需要指定编码格式为utf-8；

（2）然后需要定义一个空的字符串变量，在对文本逐行读出后将读出的内容追加到该空字符串后；

（3）逐行读出文档，然后使用for循环对该行中的每一个字符进行遍历，使用toString（）方法得到每一个字符，再使用if语句和matches（）方法检测字符是否为汉字，若匹配则对指定的变量进行自增，求出总的汉字数；

（4）再使用if语句和equals（）方法字符是否为“。” “！”和“？”三种符号之一，若为其中之一则句子数+1，由于计算平均句长需要使用总汉字数\总句子数，即需要使用到除法，故统计变量均需要使用double型变量；

（5）使用总汉字数\总句子数就可以得到该文本中每一句话的平均句长，并将结果打印出来（打印总汉字数和总句子数时强制类型转换为int型即可）；

2）任务代码

程序保存为juzi2.java，代码如下：

import java.io.*;//导入java.io包中的所有类
import java.util.Scanner;//导入java.util包中的Scanner类
public class juzi2 {
   //类名
    public static void main(String[] args)  {
   //程序主函数
        try {
   //try代码块，当发生异常时会转到catch代码块中
        	//读取指定的文件
        	Scanner s = new Scann

最低0.47元/天解锁文章

罗思洋

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Java文本处理10-计算文本平均句长

1、任务简介本节任务是计算文本平均句长，可以再上一节任务《Java文本处理9-计算文本句子数》的基础上来进行，并且还需要使用到《Java文本处理3-统计文本行数、字符数、汉字、数字、字母数等》里面关于计算文本总字数的相关方法。2、基本任务和代码1）具体思路（1）首先需要使用InputStreamReader类和BufferedReader类实现文本的读取，由于我使用的文本文档均为utf-...
复制链接

扫一扫

专栏目录