18. 常用shell之 cut - 剪切文本文件中的部分的用法和衍生用法

本文链接：https://blog.csdn.net/WQY867047910/article/details/134965699

cut 是一个在Unix和类Unix系统中常用的命令行工具，它用于剪切文本文件中的部分内容。cut 命令能够按列提取文本文件中的数据，这对于处理由分隔符分隔的数据（如CSV文件）特别有用。

基本的cut命令语法如下：

cut [选项]... [文件]...

其中，[选项]可以是以下几种：

提取特定字段：

假设有一个文件data.csv，内容如下：
```
name,age,gender
Alice,30,Female
Bob,25,Male
```
提取第二列（年龄）：
```
cut -d, -f2 data.csv
```
输出将是：
```
age
30
25
```
提取多个字段：

同样的文件，提取第一和第三列（姓名和性别）：
```
cut -d, -f1,3 data.csv
```
输出将是：
```
name,gender
Alice,Female
Bob,Male
```
按字符提取：

提取每行的前5个字符：
```
cut -c1-5 data.csv
```
如果data.csv的每行如下：
```
123456789
abcdefghi
```
则输出将是：
```
12345
abcde
```

cut 命令通常与其他命令组合使用，以实现更复杂的文本处理。例如：

与grep组合：先用grep搜索特定的行，然后用cut提取这些行的某些字段。
```
grep "Male" data.csv | cut -d, -f1
```
这将会在data.csv中搜索包含"Male"的行，并提取这些行的第一个字段（即名字）。
与sort或uniq等命令组合：使用cut提取字段，然后对这些字段进行排序或去重。
```
cut -d, -f3 data.csv | sort | uniq
```
这将会提取第三列（性别），然后对结果进行排序和去重。