java统计文本中英文单词个数split_「Linux基础知识」wc文件内容统计命令的使用...

wc用于统计文本文件的行数、单词数和字节数,命令使用格式如下:

wc 选项 文件1 文件2......

也可以将其他命令的文本输出通过管道符交由wc命令来统计:

命令字1 | 命令字2 | ...... | 命令字n | wc 选项

wc命令的常用选项包括:

-l 统计文本内容输出的行数

-w 统计文本内容输出的英文单词数(英文按照空格来分割单词)

-m 统计文本内容输出的字符数(例如:“中”的字符数是1)

-c 统计文本内容输出的字节数(例如:“中”的字节数是3,utf8编码)

wc命令常用使用方式举例如下。

①wc -l f1:统计文档中的文字行数。

②wc -c f1:统计文档中的字节数。

③wc -m f1:统计文档中的字符数。

④wc -w f1:统计文档中的单词数。

⑤wc -L f1:统计文档中最长行的长度。

⑥ls -l /etc | grep "^d" | wc -l:统计/etc/下目录的个数。执行ls -l命令后,一个目录显示为一行,所以统计行数即为统计目录数,如下图所示。

8337ddee0a687a7b435a1ca968e0eead.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
统计单词个数可以这样实现: ```java import java.util.Scanner; import java.io.*; public class WordCount { public static void main(String[] args) throws IOException { File file = new File("test.txt"); Scanner scanner = new Scanner(file); int count = 0; while (scanner.hasNext()) { count++; scanner.next(); } System.out.println("单词数:" + count); scanner.close(); } } ``` 这个程序首先打开一个名为 `test.txt` 的文件,然后用 `Scanner` 对象扫描文件的每个单词计算单词数。 统计文件的字符数、单词数和行数可以这样实现: ```java import java.util.Scanner; import java.io.*; public class FileCount { public static void main(String[] args) throws IOException { File file = new File("test.txt"); Scanner scanner = new Scanner(file); int charCount = 0; int wordCount = 0; int lineCount = 0; while (scanner.hasNextLine()) { String line = scanner.nextLine(); lineCount++; charCount += line.length(); wordCount += line.split("\\s+").length; } System.out.println("字符数:" + charCount); System.out.println("单词数:" + wordCount); System.out.println("行数:" + lineCount); scanner.close(); } } ``` 这个程序首先打开一个名为 `test.txt` 的文件,然后用 `Scanner` 对象扫描文件的每一行,计算字符数、单词数和行数。其,字符数等于每一行的字符数之和,单词数等于每一行的单词数之和,行数等于文件的行数。 需要注意的是,在计算单词数时,不能简单地使用空格分隔符,因为单词之间可能存在其他分隔符,如逗号、句号等。因此,可以使用正则表达式 `\\s+` 来匹配所有的空白符,包括空格、制表符、换行符等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值