linux awk 设置换行符,shell – awk / sed替换换行符

介绍:

我得到了一个CSV文件,其中字段分隔符是管道分类(即|).

此文件具有预定义数量的字段(例如N).我可以通过读取CSV文件的标题来发现N的值,我们可以认为这是正确的.

问题:

一些字段错误地包含换行符,这使得该行看起来比所需的短(即,它具有M个字段,其中M

if [ $# -ne 1 ]

then

echo "Usage: $0 "

exit

fi

# get first line

first_line=$(head -n 1 $1)

# get number of fields

num_separators=$(echo "$first_line" | tr -d -c '|' | awk '{print length}')

cat $1 | awk -v numFields=$(( num_separators + 1 )) -F '|' '

{

totRecords = NF/numFields

# loop over lines

for (record=0; record < totRecords; record++) {

output = ""

# loop over fields

for (i=0; i

j = (numFields*record)+i+1

# replace newline with question mark

sub("\n", "?", $j)

output = output (i > 0 ? "|" : "") $j

}

print output

}

}

'

但是,换行符仍然存在.

我该如何解决这个问题?

CSV示例:

FIRST_NAME|LAST_NAME|NOTES

John|Smith|This is a field with a

newline

Foo|Bar|Baz

预期产量:

FIRST_NAME|LAST_NAME|NOTES

John|Smith|This is a field with a * newline

Foo|Bar|Baz

* I don't care about the replacement, it could be a space, a question mark, whatever except a newline or a pipe (which would create a new field)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值