关于 "can't identify protocol" 问题的定位

      转载地址:http://blog.csdn.net/tspangle/article/details/20543329

      转载地址:http://blog.sina.com.cn/s/blog_62ec29160101qus8.html


      感谢两位作者!



问题定位步骤: 
1、 用root帐户 遍历 /proc/进程ID/fd目录,如果该目录下文件数比较大(如果大于10,一般就属于socket泄漏),根据该进程ID,可以确认该进程ID所对应的名称。 
2、 重启程序恢复服务,以便后续查找问题。 
3、 strace 该程序并记录strace信息。strace –p 进程ID >>/tmp/stracelog.log 2>&1 
4、 查看 /proc/进程ID/fd 下的文件数目是否有增加,如果发现有增加,记录上一个socket编号,停止strace 
5、 确认问题代码的位置。打开/tmp/stracelog.log,从尾部向上查找close(socket编号)所在行,可以确认在该次close后再次 创建的socket没有关闭,根据socket连接的server ip可以确认问题代码的位置。 


另一种方法:判断是否有socket泄漏:  
lsof | grep "can't identify protocol" 
如果存在很多,则代表socket泄漏,同时会显示哪个进程使用的sock未关闭。


----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------



问题
用 lsof 会看到 "can't identify protocol" 的 socket fd,很奇怪,啥情况下会这样呢?
不求甚解下,google 了一把,得到了个错误的结论:

先翻了下 lsof 的代码,发现 "can't identify protocol" 在 lsof_4.82_src/dialects/linux/dsock.c 下,说明这串文字并不是从 linux kernel 里面出来的。

试验过程
写了个简单的小程序,用 lsof 看一下。
===================== sock1.c ====================
#include  <</span>stdio.h>
#include  <</span>stdlib.h>
#include  <</span>errno.h>
#include  <</span>sys/resource.h>
#include  <</span>sys/socket.h>
#include  <</span>arpa/inet.h>
#include  <</span>netinet/in.h>
#include  <</span>unistd.h>
#include  <</span>assert.h>
#include  <</span>string.h>

int main()
{
       int fd, r;
       struct sockaddr_in sa;
       fd = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);
       sleep(60);
       return 0;
}
==================================================
在 openbsd 下:
COMMAND   PID       USER    FD    TYPE       DEVICE SIZE/OFF   NODE NAME
a.out    1649 kasicass      3u   IPv4 0xd51d9af4         0t0    TCP *:* (CLOSED)

在 debian 下:
COMMAND   PID       USER    FD    TYPE DEVICE      SIZE    NODE NAME
a.out    2356 kasicass      3u   sock      0,4               42992 can't identify protocol

很奇怪哦,正确创建的 socket fd 居然显示 "can't identify protocol"。


然后我增加一个 connect() 看看。
===================== sock2.c ====================
int main()
{
       int fd, r;
       struct sockaddr_in sa;

       fd = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);

       memset(&sa, 0, sizeof(sa));
       sa.sin_addr.s_addr = inet_addr("192.168.0.88");
       sa.sin_family         = AF_INET;
       sa.sin_port            = htons(2224);
       r = connect(fd, (struct sockaddr *)&sa, sizeof(sa));
       assert(r != -1);
       close(fd);

       sleep(60);
       return 0;
================================================
在 debian 下,连接成功:
a.out    2979 kasicass      3u   IPv4   44790         0t0      TCP 10.0.2.15:58282->192.168.0.88:2224 (ESTABLISHED)
如果连接不成功:
a.out    3001 kasicass      3u   IPv4   44885         0t0      TCP 10.0.2.15:58283->192.168.0.88:2224 (SYN_SENT)

恩,再试了下 listen() 的情况:
====================== sock3.c ===================
static int bind_and_listen(int fd, int port)
{
             struct sockaddr_in in_addr;
             int reuseaddr_on = 1;

             // addr reuse
             if (setsockopt(fd, SOL_SOCKET, SO_REUSEADDR, (const char *)&reuseaddr_on, sizeof(reuseaddr_on)) == -1)
                         return -1;

             // bind & listen
             bzero(&in_addr, sizeof(in_addr));
             in_addr.sin_family         = AF_INET;
             in_addr.sin_addr.s_addr = htonl(INADDR_ANY);
             in_addr.sin_port            = htons(port);

             if ( bind(fd, (struct sockaddr *) &in_addr, sizeof(in_addr)) == -1 )
                         return -1;

             if ( listen(fd, 64) == -1 )
                         return -1;

             return fd;
}

int main()
{
       int fd, r;

       fd = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);
       r   = bind_and_listen(fd, 2224);
       assert(r != -1);

       sleep(60);
       return 0;
}
================================================
如果 bind + listen 结果是:
a.out    3052 kasicass      3u   IPv4   45083         0t0      TCP *:2224 (LISTEN)
如果只是 bind 则:
a.out    3074 kasicass      3u   sock      0,4         0t0   45174 can't identify protocol

结论
没有再细致去看代码,不过可以推断,linux 下,lsof 对于没有 connect() or listen() 的 socket fd,都是显示 "can't identify protocol"。
而bsd下则会正确显示出 socket type。

ps. 据说shutdown后没有close会出现这个情况,待验证。:-)


  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
“无法识别协议”是一个错误信息,通常在网络连接或数据传输过程中出现。它表示无法识别使用的通信协议。 在网络通信过程中,不同的协议负责处理不同的任务,例如传输控制协议(TCP)用于在网络之间建立可靠的连接,而网际协议(IP)用于将数据包从一个网络传输到另一个网络。当出现“无法识别协议”的错误时,可能是由以下原因导致的: 1. 被防火墙阻止:某些防火墙可能会禁止一些不常见或未知的协议通过网络。如果您在尝试使用这些协议时遇到问题,可能是因为防火墙正在阻止该协议的传输。 2. 版本不匹配:如果网络连接的两端使用的协议版本不匹配,就会导致协议无法识别。这可能是由于软件版本过旧或过时导致的。 3. 错误的配置:如果网络设备或服务器的协议配置有误,可能导致协议无法识别。这可能是由于配置文件错误或设置不正确导致的。 要解决“无法识别协议”的问题,您可以尝试以下方法: 1. 检查网络连接是否正常,确保所有设备都已正确连接。 2. 检查防火墙设置,并确保未禁用所需的协议。 3. 更新软件和驱动程序,以确保使用最新的协议版本。 4. 检查网络设备和服务器的协议配置,并进行必要的更改。 如果以上方法无效,您可能需要与网络管理员或技术支持团队联系,以获取进一步的帮助和支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值