![](https://img-blog.csdnimg.cn/20210714150140529.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
linux的文本处理
主要包括文件的浏览、统计、比对。文本处理工具vim的用法和特性。文本检索工具grep、行处理工具sed和文本分析工具awk的用法。
七月不与
这个作者很懒,什么都没留下…
展开
-
正则表达式
### 字符匹配 . 代表任意单个字符,包括不仅限于字母、汉字、数字。 例:grep "谈..狗" 文件名 匹配以谈为首,以狗为尾的四字词语。 [] 代表匹配内容范围,指定任意数量单个字符(输入多个字符分开匹配) 例:grep "[0-9]" 文件名 匹配所有包含数字的内容 grep "[五月天]"文件名 匹配五、月、天三个字 [^] 代表匹配内容之外,指定任意数量单个字符(输入多个字符分开匹配) 例:grep "[^0-9]" 文件名 匹配所有不包含数字的内容 [:space:]...原创 2021-12-06 16:34:54 · 203 阅读 · 0 评论 -
awk基本用法
#### print指令 awk '{print $段数}' 文件 默认分隔符为空格,分段后匹配指定段数 awk -F分隔符 '{print $段数,$段数}' 文件 指定分隔符,匹配对应段数 awk -F "[多个分隔符]+" '{print $段数,$段数}' 文件 指定多个分隔符,匹配对应段数 awk -v 允许变量赋值 awk -v FS=分隔符 '{print $段数FS$段数}' 文件 赋值变量FS为分隔符,达到输出结果以变量为分隔符的目的 awk -v FS=分隔符 ...原创 2021-12-06 16:33:24 · 497 阅读 · 0 评论 -
sed基本用法
命令 sed 行处理工具,分为选项和动作 sed -n p 文件名 输出文件内容 sed -n '/字符/p' 文件名 输出文件中包含指定字符的行 sed -n '行数,行数p' 文件名 输出文件指定行数到指定行数的内容 sed -n '行数,行数d'文件名 删除文件指定行数到指定行数的内容 sed -e 行数a\内容 文件名 在指定行数后添加指定内容 sed -i 将修改写入文件,而不是仅输出至屏幕 sed -r 使用正则表达式 sed '行数c 内...原创 2021-12-06 16:32:19 · 110 阅读 · 0 评论 -
grep基本用法
grep "字符" 检索文件中包含该字符的行 grep -i "字符" 检索文件中包含该字符的行,检索时不区分大小写 grep -n "字符" 检索文件中包含该字符的行,并显示行号 grep -c "字符"显示文件中包含该字符的行总数 grep -o "字符" 仅显示指定字符,而不输出整行 grep -A行数 "字符"检索文件中包含该字符的行,并显示指定行的后几行数 grep -B行数 "字符"检索文件中包含该字符的行,并显示指定行的前几行数 grep -w "字符" 检索文件中包含该字符作...原创 2021-12-06 16:31:14 · 152 阅读 · 0 评论 -
vim的使用
命令模式 vim 文件名 打开文件 vim -b 文件名 打开二进制文件 vim +行数 打开文件并跳转至指定行数 命令模式的命令 行数yy 复制当前光标所在行的向下指定行数到缓冲区,未指定行数则仅复制当前光标所在行 行数dd 删除当前光标所在行的向下指定行数到缓冲区,未指定行数则仅删除当前光标所在行 p 将缓冲区内容粘贴到光标所在行的下一行,P则是下一行 r 替换光标所在处的字符 R 进入替换模式,进行多字符替换和添加 u 返回上一级操作 D 从当前光标位置删除到行尾 ggdG gg是跳转至首行第原创 2021-12-06 16:28:54 · 61 阅读 · 0 评论 -
文本分析基础命令
wc 文件名 统计文件的行总数、单词总数、字节总数 wc -m 文件名 统计文件的字符总数 wc -l 只计数行数 wc -w 只计数单词总数 wc -c 只计数字节总数 sort 文件名 以文件内的每一行的首字母为标准升序排序 sort -u 文件名 去除重复行 sort -r 文件名 以文件内的每一行的首字母为标准降序排序 sort -n 文件名 按照数值大小排序 uniq 文件名 去除前后相连的重复行 uniq -c 文件名 显示重复的行数 uniq -d 文件名 仅显示重复过的原创 2021-12-06 16:26:19 · 163 阅读 · 0 评论 -
文本查看基础命令
cat 文件名 查看文本内容 more 文件名 分页查看文件 head -行数 指定获取文件或标准输入的前几行数 head -c 字节数 指定获取文件或标准输入的前几个字节数 tail -行数 指定获取文件或标准输入的后几行数 tail -c 字节数 指定获取文件或标准输入的后几个字节数 tail -f 文件名 跟踪获取文件fb的后面新追加内容 cut -b 字节数 获取指定字节数的标准输入或文本文件字节 cut -c 字符数 获取指定字符数的标准输入或文本文件字符 cut -f 字段数 获取指定字原创 2021-12-06 16:22:37 · 227 阅读 · 0 评论