Linux进制查看工具:od、hexdump、xxd


od 命令 :http://man.linuxde.net/od


od 命令


od命令用于将指定文件内容以八进制、十进制、十六进制、浮点格式或ASCII编码字符方式显示,通常使用od命令查看特殊格式的文件内容,或者用于显示或查看文件中不能直接显示在终端的字符。

od命令系统默认的显示方式是八进制,名称源于Octal Dump。

常见的文件为文本文件和二进制文件。此命令主要用来查看保存在二进制文件中的值。比如,程序可能输出大量的数据记录,每个数据是一个单精度浮点数。这些数据记录存放在一个文件中,如果想查看下这个数据,这时候od命令就派上用场了。在我看来,od命令主要用来格式化输出文件数据,即对文件中的数据进行无二义性的解释。不管是IEEE754格式的浮点数还是ASCII码,od命令都能按照需求输出它们的值。

大家也可以了解一下hexdump命令,以十六进制输出,但感觉 hexdump 命令没有od命令强大。

Linux命令 hexdump 学习总结:http://www.cnblogs.com/kerrycode/p/5077687.html

注:常见的ASCII字符的十六进制表示

\r      0D

\n     0A

\t      09

DOS/Windows的换行符 \r\n 即十六进制表示 0D 0A

Linux/Unix的换行符      \n    即十六进制表示 0A



选项 

-a:此参数的效果和同时指定“-ta”参数相同; 
-A:<字码基数>:选择以何种基数计算字码; 
-b:此参数的效果和同时指定“-toC”参数相同; 
-c:此参数的效果和同时指定“-tC”参数相同; 
-d:此参数的效果和同时指定“-tu2”参数相同; 
-f:此参数的效果和同时指定“-tfF”参数相同; 
-h:此参数的效果和同时指定“-tx2”参数相同; 
-i:此参数的效果和同时指定“-td2”参数相同; 
-j<字符数目>或--skip-bytes=<字符数目>:略过设置的字符数目; 
-l:此参数的效果和同时指定“-td4”参数相同; 
-N<字符数目>或--read-bytes=<字符数目>:到设置的字符树目为止; 
-o:此参数的效果和同时指定“-to2”参数相同; 
-s<字符串字符数>或--strings=<字符串字符数>:只显示符合指定的字符数目的字符串; 
-t<输出格式>或--format=<输出格式>:设置输出格式; 
-v或--output-duplicates:输出时不省略重复的数据; 
-w<每列字符数>或--width=<每列字符数>:设置每列的最大字符数; 
-x:此参数的效果和同时指定“-h”参数相同; 
--help:在线帮助; 
--version:显示版本信息。



命令中各选项的含义:

-A 指定地址基数,包括:
    d 十进制
    o 八进制(系统默认值)
    x 十六进制
    n 不打印位移值

-t 指定数据的显示格式,主要的参数有:
    c ASCII字符或反斜杠序列
    d 有符号十进制数
    f 浮点数
    o 八进制(系统默认值为02) 
    u 无符号十进制数
    x 十六进制数



实  例:

[linuxde@localhost ~]$ echo abcdef g > tmp 
[linuxde@localhost ~]$ cat tmp 
abcdef g

说明:先准备一个tmp文件

[linuxde@localhost ~]$ od -b tmp 
0000000 141 142 143 144 145 146 040 147 012 
0000011

说明:使用单字节八进制解释进行输出,注意左侧的默认地址格式为八字节

[linuxde@localhost ~]$ od -c tmp 
0000000 a b c d e f g \n 
0000011

说明:使用ASCII码进行输出,注意其中包括转义字符

[linuxde@localhost ~]$ od -t d1 tmp 
0000000 97 98 99 100 101 102 32 103 10 
0000011

说明:使用单字节十进制进行解释

[linuxde@localhost ~]$ od -A d -c tmp 
0000000 a b c d e f g \n 
0000009

说明:设置地址格式为十进制。

[linuxde@localhost ~]$ od -A x -c tmp 
000000 a b c d e f g \n 
000009

说明:设置地址格式为十六进制

[linuxde@localhost ~]$ od -j 2 -c tmp 
0000002 c d e f g \n 
0000011

说明:跳过开始的两个字节

[linuxde@localhost ~]$ od -N 2 -j 2 -c tmp 
0000002 c d 
0000004

说明:跳过开始的两个字节,并且仅输出两个字节

[linuxde@localhost ~]$ od -w1 -c tmp 
0000000 a 
0000001 b 
0000002 c 
0000003 d 
0000004 e 
0000005 f 
0000006
0000007 g 
0000010 \n 
0000011

说明:每行仅输出1个字节

[linuxde@localhost ~]$ od -w2 -c tmp 
0000000 a b 
0000002 c d 
0000004 e f 
0000006 g 
0000010 \n 
0000011

说明:每行输出两个字节

[linuxde@localhost ~]$ od -w3 -b tmp 
0000000 141 142 143 
0000003 144 145 146 
0000006 040 147 012 
0000011

说明:每行输出3个字节,并使用八进制单字节进行解释



除了选项c以外的其他选项后面都可以跟一个十进制数n,指定每个显示值所包含的字节数。
说明:od命令系统默认的显示方式是八进制,这也是该命令的名称由来(Octal Dump)。
但这不是最有用的显示方式,用ASCII码和十六进制组合的方式能提供更有价值的信息输出。 

例如:

$ od - Ax - tcx1 wh5


用法示例

(1)设置第一列偏移地址以十进制显示。

od -Ad testfile
 
 
  • 1

偏移地址显示基数有:d for decimal, o for octal, x for hexadecimal or n for none。

(2)od命令不显示第一列偏移地址。

od -An testfile
 
 
  • 1

(3)以十六进制输出,默认以四字节为一组(一列)显示。

od -tx testfile
 
 
  • 1

(4)以十六进制输出,每列输出一字节。

od -tx1 testfile
 
 
  • 1

(5)显示ASCII字符和ASCII字符名称,注意换行符显示方式的区别。

#显示ASCII字符
[b3335@localhost]$ echo lvlv|od -a
0000000   l   v   l   v  nl
0000005

#显示ASCII字符名称
[b3335@localhost]$ echo lvlv|od -tc
0000000   l   v   l   v  \n
0000005
 
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9

(6)以十六进制显示的同时显示原字符。

[b3335@localhost]$ echo lvlv|od -tcx1
0000000   l   v   l   v  \n
         6c  76  6c  76  0a
0000005
 
 
  • 1
  • 2
  • 3
  • 4

(7)指定每行显示512字节。

od -w512 -tx1 testfile
 
 
  • 1

(8)od命令输出时去除列与列之间的空格符。 
当我们需要将文件内容显示为十六进制,需要输出连续的单个字节,每个字节以十六进制显示。这时我们可以通过od命令将文件以单个字节为一组,十六进制输出在同一行,并去除每个字节之间的空格。目前还不知道怎么通过指定od命令的相关选项去除列与列之间的空格,也许od命令本身并不支持。我的做法是: 
(8.1)使用-An不输出偏移地址; 
(8.2)使用-v输出时不省略重复的数据; 
(8.3)使用-tx1以单个字节为一组按照十六进制输出,-w1每列输出一个字节; 
(8.4)最后通过管道传递给awk的标准输入,通过awk不换行输出所有行,拼接为一行输出。

具体命令如下:

od -An -w1 -tx1 testfile|awk '{for(i=1;i<=NF;++i){printf "%s",$i}}'


od、hexdump、xxd---进制查看工具

三个命令都可以像UltraEdit那样以16进制的方式查看文件。hexdump的输入格式最灵活,因为它有专门的参数指定格式, 常用选项 -C。od没什么特点,od -x 和不带选项的xxd差不多。xxd还可以通过-r选项把16进制表示的反转换为正常的文件因为它默认的表示方式和UltraEdit最像:以位移开头,然后每两字节一组,每行最后有相应字节的文件显示

提到linux/unix下的进制查看工具,不得不提到标题上的三个工具。三者之间我个人感觉hexdump在使用上最平易近人,和windows下的winhex接近。而xxd是可以看作是od的升级产品。且其-r选项把16进制表示的反转换为正常的文件。比较像是ultraedit软件的十六进制查看。而od作为老牌的进制查看工具,个人感觉使用上比较麻烦。且显示方式上不如上面两个工个。而本篇着重介绍下hexdump的用法。(之前在windos下有用过winhex,比较喜欢其显示的方式。)


常用参数

如果要看到较理想的结果,使用-C参数,显示结果分为三列(文件偏移量、字节的十六进制、ASCII字符)。

格式:hexdump -C binfile

一般文件都不是太小,最好用less来配合一下。

格式:hexdump -C binfile | less


示例一 比较各种参数的输出结果

[root@new55 ~]# echo /etc/passwd | hexdump
0000000 652f 6374 702f 7361 7773 0a64         
000000c
[root@new55 ~]# echo /etc/passwd | od -x
0000000 652f 6374 702f 7361 7773 0a64
0000014
[root@new55 ~]# echo /etc/passwd | xxd
0000000: 2f65 7463 2f70 6173 7377 640a            /etc/passwd.
[root@new55 ~]# echo /etc/passwd | hexdump -C      <== 规范的十六进制和ASCII码显示(Canonical hex+ASCII display )
00000000  2f 65 74 63 2f 70 61 73  73 77 64 0a              |/etc/passwd.|
0000000c
[root@new55 ~]# echo /etc/passwd | hexdump -b      <== 单字节八进制显示(One-byte octal display)
0000000 057 145 164 143 057 160 141 163 163 167 144 012               
000000c
[root@new55 ~]# echo /etc/passwd | hexdump -c      <== 单字节字符显示(One-byte character display)
0000000   /   e   t   c   /   p   a   s   s   w   d  n               
000000c
[root@new55 ~]# echo /etc/passwd | hexdump -d      <== 双字节十进制显示(Two-byte decimal display)
0000000   25903   25460   28719   29537   30579   02660               
000000c
[root@new55 ~]# echo /etc/passwd | hexdump -o       <== 双字节八进制显示(Two-byte octal display)
0000000  062457  061564  070057  071541  073563  005144               
000000c
[root@new55 ~]# echo /etc/passwd | hexdump -x       <== 双字节十六进制显示(Two-byte hexadecimal display)
0000000    652f    6374    702f    7361    7773    0a64               
000000c
[root@new55 ~]# echo /etc/passwd | hexdump -v
0000000 652f 6374 702f 7361 7773 0a64         
000000c

比较来比较去,还是hexdump -C的显示效果更好些。


示例二 确认文本文件的格式

文本文件在不同操作系统上的行结束标志是不一样的,经常会碰到由此带来的问题。
比如Linux的许多命令不能很好的处理DOS格式的文本文件。Windows/DOS下的文本文件是以rn作为行结束的,而Linux/Unix下的文本文件是以n作为行结束的。

[root@new55 ~]# cat test.bc
123*321
123/321
scale=4;123/321

[root@new55 ~]# hexdump -C test.bc
00000000  31 32 33 2a 33 32 31 0a   31 32 33 2f 33 32 31 0a  |123*321.123/321.|
00000010  73 63 61 6c 65 3d 34 3b  31 32 33 2f 33 32 31 0a  |scale=4;123/321.|
00000020  0a                                                |.|
00000021
[root@new55 ~]#
注:常见的ASCII字符的十六进制表示

r      0D
n     0A
t      09
DOS/Windows的换行符 rn 即十六进制表示 0D 0A
Linux/Unix的换行符      n    即十六进制表示 0A

示例三 查看wav文件

有些IVR系统需要8K赫兹8比特的语音文件,可以使用hexdump看一下具体字节编码。

[root@web186 root]# ls -l tmp.wav
-rw-r--r--    1 root     root        32381 2010-04-19  tmp.wav
[root@web186 root]# file tmp.wav
tmp.wav: RIFF (little-endian) data, WAVE audio, ITU G.711 a-law, mono 8000 Hz

[root@web186 root]# hexdump -C tmp.wav | less
00000000  52 49 46 46 75 7e 00 00  57 41 56 45 66 6d 74 20  |RIFFu~..WAVEfmt |
00000000  52 49 46 46 75 7e 00 00  57 41 56 45 66 6d 74 20  |RIFFu~..WAVEfmt |
00000010  12 00 00 00 06 00 01 00  40 1f 00 00 40 1f 00 00  |........@...@...|
00000020  01 00 08 00 00 00 66 61  63 74 04 00 00 00 43 7e  |......fact....C~|
00000030  00 00 64 61 74 61 43 7e  00 00 d5 d5 d5 d5 d5 d5  |..dataC~........|
00000040  d5 d5 d5 d5 d5 d5 d5 d5  d5 d5 d5 d5 d5 d5 d5 d5  |................|
*
000000a0  d5 d5 d5 d5 d5 d5 d5 d5  d5 55 d5 55 d5 d5 55 d5  |.........U.U..U.|
000000b0  55 d5 d5 55 d5 55 d5 d5  55 d5 55 55 55 55 55 55  |U..U.U..U.UUUUUU|
000000c0  55 55 55 55 55 55 55 d5  d5 d5 d5 d5 d5 d5 d5 d5  |UUUUUUU.........|



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值