如何从TCP中提取HTTP报文


最近在做个与网络安全相关的项目,项目中要捕获各种数据包并进行分析; 下面是如何从TCP 中提取HTTP 数据。

前提:捕获的数据包(我用的是wireshark 捕获的数据包)

1:发现TCP报文;

我们捕获的数据包是经过多次包装的数据,最常见的包装为Ethernet II  -> IP  -> TCP/UDP ->应用层协议(HTTP 等)。

要发现IP数据包下的TCP报文,我们可以根据IP首部的协议类型来判断,常见的协议类型有:

1:ICMP

2:IGMP

6:TCP

17:UDP, 等

2:发现TCP 报文后,我们就要对TCP 报文进行进一步的处理,首先对其首部进行处理,可以获取到源端口、目的端口、首部长度、标志位、序列号、确认号、校验和、等信息;但是如何在确定下面包装的是不是HTTP报文确实有些麻烦。最开始打算通过端口号来确定,我们知道HTTP默认使用的是80 端口;虽然可以发现一些HTTP 报文,但是我们知道端口号是可以改变的;所以这样可能会出现遗漏的情况。

后来,想通过对TCP 的数据部分进行正则匹配,匹配HTTP 报文必须的关键字,如:“请求报文” “响应报文”的首部,看看是否符合HTTP 报文的格式,

匹配代码:

String string = new String(tcpdata);
		
		//判断是否为HTTP 报文(通过正则表达式 判断数据是否具有HTTP 协议的格式)
		Pattern pattern = Pattern.compile("[a-zA-Z]{3,7} .* HTTP/1.[0,1]");//匹配所有的HTTP 请求报文
		Matcher matcher = pattern.matcher(string);
		Pattern pattern2 = Pattern.compile("^HTTP/1.[0,1] [0-9]{0,3} *");//匹配所有的HTTP 响应报文
		Matcher matcher2 = pattern2.matcher(string);
		if (matcher.find() || matcher2.find()) {
			System.out.println(string.split("\r\n")[0]);
		}

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值