统计txt文件字数

原创 2015年07月09日 23:17:52

本次demo,旨在统计一本小说《斗破苍穹前传之药老传奇》的汉字字数;技术上,主要是用Java的Pattern类实现;

代码贴上:

java

String protect_Path = System.getProperty("user.dir"); //项目路径
        //获取文件对应的BufferedReader
        BufferedReader br = new BufferedReader(new FileReader(new File(protect_Path + "/src/斗破苍穹前传之药老传奇.txt")));

        String tempstr; //临时字符串
        int num_of_words = 0; //总汉字数
        int num_of_wordsAndPunctuation = 0; //汉字+标点
        int num_blank = 0; //空格字符

        Pattern pattern =  Pattern.compile("([\u4e00-\u9fa5]{1})"); //定义匹配模式:1个汉字
        Pattern pattern2 = Pattern.compile("([\u4e00-\u9fa5,,.。、/<>??;;'‘’:\"【】{}]{1})"); //定义匹配模式:汉字或标点符号
        Pattern pattern3 = Pattern.compile("[\\s]");

        while((tempstr = br.readLine()) != null && tempstr != ""){

            //汉字匹配,统计字数
            Matcher matcher = pattern.matcher(tempstr);
            while(matcher.find()) num_of_words++;

            //汉字标点匹配,统计字数
            Matcher matcher2 = pattern2.matcher(tempstr);
            while(matcher2.find()) num_of_wordsAndPunctuation++;

            //空格匹配,统计字数
            Matcher matcher3 = pattern3.matcher(tempstr);
            while(matcher3.find()) num_blank++;

            tempstr = "";
        }

        br.close(); //关闭文件
        System.out.println("总汉字数:" + num_of_words);
        System.out.println("总汉字标点数:" + num_of_wordsAndPunctuation);
        System.out.println("总空格数:" + num_blank);

运行结果:

总汉字数:186483
总汉字标点数:210916
总空格数:4769
版权声明:本文为博主原创文章,未经博主允许不得转载。

Java简单统计文本字数方法

Java简单统计文本字数方法
  • huawangxin
  • huawangxin
  • 2016年11月23日 01:04
  • 2048

统计txt文本中各个字符出现的频率和次数

#include#includeint main(){  char file[10000]; int statistic[127]; int i=0,j; FILE *fp; if((fp=fopen...
  • zhoulingjie311
  • zhoulingjie311
  • 2011年03月03日 22:41
  • 2695

php 统计可读字数

$recordset = array(array('body'=>'中国人李34团%$长教#@$导我,们.说,年学子应该《参军》。李?!~老【团长--还教】导,我aa们说,接b受t军“队”的管理?和....
  • fengjunoo
  • fengjunoo
  • 2016年06月11日 14:41
  • 604

PHP读取doc,docx,xls,pdf,txt内容

我的一个客户有这样的需求:上传文件,可以是doc,docx,xls,pdf,txt格式,现需要用php读取这些文件的内容,然后计算文件里面字数.1.PHP读取DOC格式的文件      PHP没有自带...
  • zhoubl668
  • zhoubl668
  • 2016年12月19日 16:43
  • 5945

python统计文本字数

#-*-coding:utf-8-*- contents = open("d:file.ini","r").read() mylen = len(contents) line_num = conten...
  • DXLDeHuaLi
  • DXLDeHuaLi
  • 2017年05月14日 00:38
  • 684

java 判断含有中文的字符串的长度

public static boolean isLetter(char c) { int k = 0x80; return c / k == 0 ? true : ...
  • z69183787
  • z69183787
  • 2014年01月28日 16:41
  • 36378

txt字数统计

  • 2014年07月04日 09:29
  • 214KB
  • 下载

统计txt文件字数

java中正则表达式demo
  • u010137431
  • u010137431
  • 2015年07月09日 23:17
  • 1092

字数统计

一天,淘气的Tom不小心将水泼到了他哥哥Jerry刚完成的作文上。原本崭新的作文纸顿时变得皱巴巴的,更糟糕的是由于水的关系,许多字都看不清了。可怜的Tom知道他闯下大祸了,等Jerry回来一定少不了一...
  • TangTWT
  • TangTWT
  • 2018年01月31日 21:30
  • 9

统计Txt文件中数字的个数

/******************************************************************** /*功能:统计txt文件中16进制数字个数。PS最后一个数...
  • Shayne_Lee
  • Shayne_Lee
  • 2016年08月16日 21:55
  • 532
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:统计txt文件字数
举报原因:
原因补充:

(最多只允许输入30个字)