我有一个数百行的文件格式如下:
#blah
RewriteCond %{HTTP_HOST} www.blah.com [NC]
RewriteRule ^/xyz(|/)$http://www.blah.com/404.html [R=301,L,NC]
#xblah
RewriteCond %{HTTP_HOST} www.blah.com [NC]
RewriteRule ^/hkf(|/)$http://www.blah.com/404.html [R=301,L,NC]
#ablah
RewriteCond %{HTTP_HOST} www.blah.com [NC]
RewriteRule ^/abc/.*(|/)$http://www.blah.com/404.html [R=301,L,NC]
我想在awk / sed中创建一个脚本,使用每组文本第三行中的第二个参数对该文件进行字母顺序排列.在这个文件的情况下,它是“abc”,“hkf”或“xyz”,可以是任何东西 – 它们是在这个apache重定向文件中创建的重定向.
我想我想做的是:
>将每组三条线连接成一条线,每条线之间有一个分隔符
>使用sort -k3,3对行进行排序
>然后用分离的空白行重新组装3行构造
>写入文件
我的预期输出看起来像这样:
#ablah
RewriteCond %{HTTP_HOST} www.blah.com [NC]
RewriteRule ^/abc/.*(|/)$http://www.blah.com/404.html [R=301,L,NC]
#xblah
RewriteCond %{HTTP_HOST} www.blah.com [NC]
RewriteRule ^/hkf(|/)$http://www.blah.com/404.html [R=301,L,NC]
#blah
RewriteCond %{HTTP_HOST} www.blah.com [NC]
RewriteRule ^/xyz(|/)$http://www.blah.com/404.html [R=301,L,NC]
这有意义吗?有一个更好的方法吗?
附:我的目的是使脚本可移植,以便它可以在这个结构的几个文件上使用.在建议解决问题的代码时,请尽可能地拼出像我这样的新职级,开始了解如何有效地解决这个问题,并能够扩展最终结果.
任何和所有的帮助非常感谢.
您可以在Gnu Awk中完成整个操作:
awk -f sort.awk input.txt
sort.awk在哪里
BEGIN {
RS=""
}
{
match($0,/RewriteRule \^\/(.*)\(\|/,a)
key[NR]=a[1] "\t" NR
block[NR]=$0
}
END {
asort(key)
for (i=1; i<=NR; i++) {
split(key[i],a,"\t")
print block[a[2]]
printf "\n"
}
}
生产:
#ablah
RewriteCond %{HTTP_HOST} www.blah.com [NC]
RewriteRule ^/abc/.*(|/)$http://www.blah.com/404.html [R=301,L,NC]
#xblah
RewriteCond %{HTTP_HOST} www.blah.com [NC]
RewriteRule ^/hkf(|/)$http://www.blah.com/404.html [R=301,L,NC]
#blah
RewriteCond %{HTTP_HOST} www.blah.com [NC]
RewriteRule ^/xyz(|/)$http://www.blah.com/404.html [R=301,L,NC]