Java文本处理10-计算文本平均句长

这篇博客介绍了如何在Java中计算文本的平均句长。首先,任务基于之前文本处理任务,利用InputStreamReader和BufferedReader读取utf-8编码的文本。接着,遍历文本,统计汉字数和包含句号、感叹号、问号的句子数。通过总汉字数除以总句子数得到平均句长。博主提供了代码示例,并展示了对简单文本和《西游记》的计算结果。
摘要由CSDN通过智能技术生成

1、任务简介

本节任务是计算文本平均句长,可以再上一节任务《Java文本处理9-计算文本句子数》的基础上来进行,并且还需要使用到《Java文本处理3-统计文本行数、字符数、汉字、数字、字母数等》里面关于计算文本总字数的相关方法。


2、基本任务和代码

1)具体思路

(1)首先需要使用InputStreamReader类和BufferedReader类实现文本的读取,由于我使用的文本文档均为utf-8编码,所以还需要指定编码格式为utf-8;

(2)然后需要定义一个空的字符串变量,在对文本逐行读出后将读出的内容追加到该空字符串后;

(3)逐行读出文档,然后使用for循环对该行中的每一个字符进行遍历,使用toString()方法得到每一个字符,再使用if语句和matches()方法检测字符是否为汉字,若匹配则对指定的变量进行自增,求出总的汉字数;

(4)再使用if语句和equals()方法字符是否为“。” “!”和“?”三种符号之一,若为其中之一则句子数+1,由于计算平均句长需要使用总汉字数\总句子数,即需要使用到除法,故统计变量均需要使用double型变量;

(5)使用总汉字数\总句子数就可以得到该文本中每一句话的平均句长,并将结果打印出来(打印总汉字数和总句子数时强制类型转换为int型即可);

2)任务代码

程序保存为juzi2.java,代码如下:

import java.io.*;//导入java.io包中的所有类
import java.util.Scanner;//导入java.util包中的Scanner类
public class juzi2 {
   //类名
    public static void main(String[] args)  {
   //程序主函数
        try {
   //try代码块,当发生异常时会转到catch代码块中
        	//读取指定的文件
        	Scanner s = new Scann
  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值