IPv4地址
最初设计互联网络时,为了便于寻址和层次化构造网络,每个IP地址包括两个标识码(ID),即网络ID和主机ID。同一个物理网络上的所有主机都使用同一个网络ID,网络上的一个主机(包括网络上的工作站,服务器和路由器等)有一个主机ID与其对应。Internet委员会定义了5种IP地址类型以适应不同容量的网络,即A类~E类。
类别 | IP地址范围 | 最大网络数 | 最大主机数 | 私有IP地址范围 |
A | 0.0.0.0~127.255.255.255 | 126(2^7 - 2)(A类地址的前缀为"0",网络ID标识码的位数为8位,网络号不能全为0且127.0.0.0网络保留用于回路测试,所以最大网络数为2^7-2) | 16777214(2^24 - 2 ) | 10.0.0.0~10.255.255.255 |
B | 128.0.0.0~191.255.255.255 | 16384(2^14) (B类地址的前缀为"10",网络ID标识码的位数为16位,因此最大网络数为(2^14)) | 65534(2^16 - 2) | 172.16.0.0~172.31.255.255 |
C | 192.0.0.0~223.255.255.255 | 2097152(2^21)(C类地址的前缀为"110",网络ID标志码的位数为24位,因此最大网络数为(2^21)) | 254(2^8 - 2) | 192.168.0.0~192.168.255.255 |
D | 224.0.0.0~239.255.255.255 | D类地址的前缀为"1110" | ||
E | 240.0.0.0~255.255.255.255 | E类地址的前缀为"1111" |
IPv4地址由4组数字组成,每组数字之间以.分隔,每组数字的取值范围是0~255.
IPv4必须满足以下四条规则:
- 任何一个1位或者两位数字,即0~99;
- 任何一个以1开头的3位数字,即100~199;
- 任何一个以2开头,第二位数字在0~4之间的数字即200~249;
- 任何一个以25开头,第三位数字在0~5之间的三位数字,即250~255;
首先满足第一条规则的正则是:
((\d{1,2})
满足第二条规则的正则是:
(1\d{1,2})
满足第三条规则的正则是:
(2[0-4]\d)
满足第四条规则的正则是:
(25[0-5])
将其组合起来就能得到一个能匹配0~255的正则表达式了:
((\d{1,2})|(1\d{1,2})|(2[0-4]\d)|(25[0-5]))
IPv4地址由4个这样的数字组成,中间用"."隔开,所以可以匹配IPv4的正则表达式为:
(((\d{1,2})|(1\d{1,2})|(2[0-4]\d)|(25[0-5]))\.){3}((\d{1,2})|(1\d{1,2})|(2[0-4]\d)|(25[0-5]))
使用边界匹配,不然256.1.1.1也会匹配成功,会匹配成56.1.1.1,那么最终正确的匹配IPv4的正则表达式为:
(?=(\b|\D))(((\d{1,2})|(1\d{1,2})|(2[0-4]\d)|(25[0-5]))\.){3}((\d{1,2})|(1\d{1,2})|(2[0-4]\d)|(25[0-5]))(?=(\b|\D))
IPv6地址
IPv6的128位地址通常写成8组,每4组为4个十六进制数。比如:AD80:0000:0000:0000:ABAA:0000:00C2:0002 是一个合法的IPv6地址。这个地址比较长,看起来不方便也不易于书写。零压缩法可以用来缩减其长度。如果几个连续段位的值都是0,那么这些0就可以简单的一::来表示,上述地址就可以写成AD80::ABAA:0000:00C2:0002.这里需要注意的是只能简化连续的段位的0,其前后的0都要保留,比如AD80的最后的这个0,不能被简化。当然也可以在ABAA后面使用::,这样的话前面的12个0就不能压缩了。这个限制的目的是为了能准确的还原被压缩的0,不然就无法确定每个::代表多少个0.
支持IPv6基本格式的正则表达式:
^([\\da-fA-F]{1,4}:){7}([\\da-fA-F]{1,4})$