1、问题描述
最近须要利用Shell将多行多列文本中某一列,经过指定的分隔符合并成一行。假设须要处理的文本以下:
咱们主要处理的是,将用户名提取处理,合并成一行,并经过逗号进行分隔。最终的格式以下:html
“li1”,”huan”,”wang”,”wu”,”78c”,”zh”,”liu”,”zhao”,”xu”,”yang”nginx
2、解决方案
首先是提取每一行的第X列,我最早可以想到的是awk命令,以下web
awk '{print $2}' user1.txt
效果以下:
接着,是否是能够把替换符替换为逗号呢?
使用tr命令svg
awk '{print $2}' user1.txt |tr "\n" ","
效果:
看着好像是很接近,咱们将上面的 , 分隔改成”,”分隔,是否是就okey了呢?命令以下:工具
awk '{print $2}' user1.txt |tr "\n" "\",\""
只是很遗憾,执行效果以下:
为何呢?spa
由于tr是单个字符处理工具,而不是字符串处理工具。code
既然tr不能够替换字符串,那么我们就用sed命令。由于sed命令不单单能够处理字符,还能够处理字符串。xml
先来个简单的,将换行替换成逗号,命令以下:htm
awk '{print $2}' user1.txt |sed 's/\n/,/g'
执行结果以下:
好吧,居然不听话。为何呢?blog
由于sed命令处理过程是:从文本流中读取一行文本后,先把换行符去掉,而后进行相应的命令,处理完后再添加上换行符。这就致使sed命令,没法对换行符进行直接替换。
既然这样行不通,怎么搞呢?
解决方案一:
既然sed不能修改换行符,那就是在使用sed以前,把换行符干掉。干掉换行符,能够使用tr和xargs命令。
#使用xargs命令干掉换行符
awk '{print $2}' user1.txt |xargs
#使用tr命令干掉换行符
awk '{print $2}' user1.txt |tr "\n" " "
使用sed命令将空格替换成”,”,命令以下:
awk '{print $2}' user1.txt |xargs |sed 's/ /","/g'
可是开头和结尾少了一个双引号,解决方案以下:
echo '"'`awk '{print $2}' user1.txt |xargs |sed 's/ /","/g'`'"'
解决方案二:
echo '"'`awk '{print $2}' user1.txt | sed ':label;N;s/\n/","/;b label'`'"'