![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/887ef67b35db4327808675712df5e240.png)
Pre
OpenSource - Ip2region 离线IP地址定位库和IP定位数据管理框架
Ip2region - 基于xdb离线库的Java IP查询工具提供给脚本调用
IP源
Code实现
package com.artisan.util;
import cn.hutool.core.io.FileUtil;
import java.io.File;
import java.nio.charset.StandardCharsets;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.stream.Collectors;
/**
* @author 小工匠
* @version 1.0
* @date 2024/7/28 14:40
* @mark: show me the code , change the world
*/
public class IpDataAggregator {
/**
* 主函数,用于处理特定国家的IP数据。
* 具体步骤包括:
* 1. 从指定文件中读取所有IP数据。
* 2. 过滤出包含“中国”关键字的IP数据。
* 3. 将这些数据聚合到各个城市。
* 4. 为每个城市的IP数据生成一个规则文件。
*
* @param args 命令行参数,未使用。
*/
public static void main(String[] args) {
// 定义原始IP数据文件路径。
String filePath = "D:\\IdeaProjects\\ip2region-master\\data\\ip.merge.txt";
// 定义目标IP数据文件路径。
String chinaData = "D:\\IdeaProjects\\ip2region-master\\data\\china.txt";
String innerIpData = "D:\\IdeaProjects\\ip2region-master\\data\\inner.txt";
// 如果目标文件已存在,则删除之。
if (chinaData != null) {
FileUtil.del(chinaData);
}
// 如果目标文件已存在,则删除之。
if (innerIpData != null) {
FileUtil.del(innerIpData);
}
File chinaDataFile = null;
File innerIpDataFile = null;
// 读取原始IP数据文件,过滤出包含“中国”的行,并写入目标文件。
for (String line : FileUtil.readLines(filePath, StandardCharsets.UTF_8)) {
if (line.contains("中国") ) {
chinaDataFile = FileUtil.appendUtf8String(line + "\n", chinaData);
}
if (line.contains("内网")) {
innerIpDataFile = FileUtil.appendUtf8String(line + "\n", innerIpData);
}
}
// 读取目标文件中的中国IP数据。
// China IP 数据
List<String> chinaIpData = FileUtil.readLines(chinaDataFile, StandardCharsets.UTF_8);
// 聚合中国IP数据到各个城市。
// 调用聚合函数并打印结果
Map<String, List<String>> aggregatedData = aggregateDataByCity(chinaIpData);
// 为每个城市生成IP规则文件
extracted(aggregatedData , "city");
// 重新聚合数据到省份
aggregatedData = aggregateDataByProvince(chinaIpData);
// 为每个省份生成IP规则文件
extracted(aggregatedData , "province");
// 处理内网数据
List<String> innerIpDataList = FileUtil.readLines(innerIpDataFile, StandardCharsets.UTF_8);
// 203.0.113.0|203.0.113.255|0|0|0|内网IP|TPG电信
aggregatedData = aggregateDataByCity(innerIpDataList);
extracted(aggregatedData, "inner");
}
private static void extracted(Map<String, List<String>> aggregatedData,String type) {
// 遍历聚合后的数据,为每个城市生成IP规则文件。
for (Map.Entry<String, List<String>> entry : aggregatedData.entrySet()) {
// 如果城市规则文件已存在,则删除之。
if (FileUtil.exist("D:\\IdeaProjects\\ip2region-master\\data\\ips\\" + type + "\\" + entry.getKey() + ".rule")) {
FileUtil.del("D:\\IdeaProjects\\ip2region-master\\data\\ips\\" + type + "\\" + entry.getKey() + ".rule");
}
// 构建城市IP规则字符串。
StringBuilder sb = new StringBuilder();
for (String ipRange : entry.getValue()) {
sb.append(ipRange);
}
//sb.append("deny all;");
// 将城市IP规则写入文件。
FileUtil.appendUtf8String(sb.toString(), "D:\\IdeaProjects\\ip2region-master\\data\\ips\\" + type + "\\" + entry.getKey() + ".rule");
}
}
/**
* 根据省份聚合数据。
* 该方法通过遍历输入数据列表,将每个数据项根据其所属省份进行分组。
* 数据项被拆分为多个部分,其中倒数第三个部分代表了省份信息。
* 方法返回一个映射,其中键是省份,值是该省份下的数据项列表。
*
* @param data 输入的数据列表,每个数据项以管道符("|")分隔。
* @return 返回一个映射,其中键是省份,值是该省份的数据项列表。
*/
private static Map<String, List<String>> aggregateDataByProvince(List<String> data) {
// 初始化一个映射,用于存储按省份聚合后的数据。
Map<String, List<String>> aggregatedData = new HashMap<>();
// 遍历输入数据列表。
data.stream().forEach(line -> {
// 将每个数据项按管道符分割成多个部分。
// 分割字符串
String[] parts = line.split("\\|");
// 获取该数据项所属的省份信息。
// 获取倒数第三个分组 省份
String city = parts[parts.length - 3];
// 将数据项添加到对应省份的列表中。
// 如果该省份尚未存在于映射中,则先创建一个空列表。
// 将行数据添加到对应省份的列表中
aggregatedData.computeIfAbsent(city, k -> new ArrayList<>()).add(parts[0] + "|" + parts[1]);
});
// 将聚合后的数据转换为指定格式后返回。
return getStringListMap(aggregatedData);
}
/**
* 根据城市对数据进行聚合。
* 该方法通过遍历输入的数据列表,将每个数据项根据城市进行分组,最终返回一个映射表,其中键是城市名,值是该城市的数据项列表。
* 数据项是以管道符("|")分隔的字符串,本方法将每个数据项的第一个和第二个部分组合起来,作为聚合后的值。
*
* @param data 数据列表,每个元素是一个以管道符分隔的字符串,代表一个数据项。
* @return 返回一个映射表,其中键是城市名,值是该城市的数据项列表。
*/
private static Map<String, List<String>> aggregateDataByCity(List<String> data) {
// 初始化一个哈希映射,用于存储聚合后的数据。
Map<String, List<String>> aggregatedData = new HashMap<>();
// 遍历数据列表中的每个元素。
data.stream().forEach(line -> {
// 将每个数据项按管道符分割,以获取其组成部分。
// 分割字符串
String[] parts = line.split("\\|");
// 获取倒数第二个部分作为城市名。
// 获取倒数第二个分组
String city = parts[parts.length - 2];
// 如果映射中尚未存在该城市,则初始化一个列表,并将该数据项添加到列表中。
// 如果已存在,则直接将该数据项添加到列表中。
// 将行数据添加到对应城市的列表中
aggregatedData.computeIfAbsent(city, k -> new ArrayList<>()).add(parts[0] + "|" + parts[1]);
});
// 调用getStringListMap方法对聚合后的数据进行处理,然后返回。
return getStringListMap(aggregatedData);
}
/**
* 对给定的IP范围列表进行聚合,将每个城市的IP范围转换为CIDR格式的列表。
*
* @param aggregatedData 包含城市和IP范围列表的映射。
* @return 返回转换后的映射,其中IP范围以CIDR格式列出。
*/
private static Map<String, List<String>> getStringListMap(Map<String, List<String>> aggregatedData) {
// 遍历映射中的每个条目,对每个城市的IP范围进行处理
aggregatedData.forEach((city, ranges) -> {
// 初始化一个列表,用于存储聚合后的CIDR表达式
// 对每个城市进行IP范围聚合
List<String> aggregatedRanges = new ArrayList<>();
// 遍历城市的每个IP范围
for (String range : ranges) {
// 使用竖线字符分割起始IP和结束IP
String[] ips = range.split("\\|");
// 将起始IP和结束IP转换为CIDR列表
List<String> cidrList = IPCidrConverter.rangeToCIDR(ips[0], ips[1]);
// 将CIDR列表转换为"allow"规则的字符串列表
List<String> targetList = cidrList.stream().map(cidr -> "allow " + cidr + ";\n").collect(Collectors.toList());
// 将转换后的规则列表添加到聚合后的列表中
aggregatedRanges.addAll(targetList);
}
// 更新映射,将城市的IP范围列表替换为聚合后的CIDR规则列表
aggregatedData.put(city, aggregatedRanges);
});
// 返回处理后的映射
return aggregatedData;
}
}
package com.artisan.util;
import java.util.ArrayList;
import java.util.List;
public class IPCidrConverter {
public static void main(String[] args) {
String[] ipRanges = {
"1.204.0.0|1.204.255.255",
"1.207.96.0|1.207.127.255",
"11.191.39.128|11.191.39.255",
"11.192.60.0|11.192.63.255",
"11.208.171.0|11.208.171.255",
"11.208.184.0|11.208.203.255",
"36.111.160.0|36.111.191.255",
"36.114.0.0|36.114.255.255",
"42.123.96.0|42.123.127.255",
"42.247.2.200|42.247.2.207",
"42.247.9.120|42.247.9.127",
"42.247.14.48|42.247.14.63",
"42.247.20.64|42.247.20.79",
"42.247.33.160|42.247.33.175",
"42.247.35.192|42.247.35.223",
"42.247.45.64|42.247.45.79",
"43.236.68.0|43.236.71.255",
"43.250.116.0|43.250.119.255",
"43.250.216.0|43.250.219.255",
"43.254.100.0|43.254.103.255",
"43.255.192.0|43.255.195.255",
"45.248.88.0|45.248.91.255",
"45.251.92.0|45.251.95.255",
"45.251.100.0|45.251.103.255",
"58.16.0.0|58.16.72.255",
"58.16.75.0|58.16.99.255",
"58.16.102.0|58.16.105.255",
"58.16.129.0|58.16.135.255",
"58.16.139.0|58.16.143.255",
"58.16.181.0|58.16.181.255",
"58.16.224.0|58.16.235.255",
"58.16.240.0|58.16.240.255",
"58.16.242.0|58.16.242.255",
"58.16.244.0|58.16.255.255",
"58.42.0.0|58.42.63.255",
"58.42.112.0|58.42.127.255",
"58.42.224.0|58.42.255.255",
"59.51.128.0|59.51.191.255",
"59.80.0.0|59.80.255.255",
"61.159.128.0|61.159.135.255",
"61.189.128.0|61.189.177.255",
"61.189.254.0|61.189.255.255",
"61.236.179.0|61.236.179.255",
"61.236.182.0|61.236.182.127",
"61.236.184.0|61.236.185.127",
"61.236.189.0|61.236.193.255",
"61.236.194.64|61.236.194.127",
"61.237.2.28|61.237.2.31",
"61.237.3.160|61.237.3.163",
"61.237.15.32|61.237.15.63",
"61.237.97.100|61.237.97.103",
"61.237.122.142|61.237.122.143",
"61.237.124.106|61.237.124.107",
"61.237.124.110|61.237.124.111",
"61.237.124.114|61.237.124.115",
"61.243.0.0|61.243.6.255",
"61.243.38.0|61.243.38.255",
"61.243.40.0|61.243.41.255",
"61.243.43.0|61.243.44.255",
"101.238.0.0|101.238.255.255",
"103.3.152.0|103.3.152.255"
};
for (String range : ipRanges) {
String[] ips = range.split("\\|");
List<String> cidrList = rangeToCIDR(ips[0], ips[1]);
for (String cidr : cidrList) {
System.out.println(cidr);
}
}
}
/**
* 将IP地址范围转换为CIDR格式的IP段列表。
*
* @param startIp 起始IP地址,包含在范围内。
* @param endIp 结束IP地址,包含在范围内。
* @return CIDR格式的IP段列表。
*/
public static List<String> rangeToCIDR(String startIp, String endIp) {
// 将起始和结束IP地址转换为长整型以便计算
long start = ipToLong(startIp);
long end = ipToLong(endIp);
List<String> result = new ArrayList<>();
// 遍历每个IP地址,直到达到结束IP
while (end >= start) {
// 初始化CIDR的掩码大小为32
byte maxSize = 32;
// 逐渐减小掩码大小,寻找最合适的CIDR值
while (maxSize > 0) {
// 计算对应掩码大小的掩码值
long mask = CIDRToMask(maxSize - 1);
// 对起始IP应用掩码
long maskedBase = start & mask;
// 如果应用掩码后的结果不是起始IP,则说明当前掩码大小不合适
if (maskedBase != start) {
break;
}
// 尝试更小的掩码大小
maxSize--;
}
// 计算理论上的最大子网掩码大小
double x = Math.log(end - start + 1) / Math.log(2);
byte maxDiff = (byte) (32 - Math.floor(x));
// 如果当前掩码大小小于理论上的最大子网掩码大小,则调整为理论上的最大值
if (maxSize < maxDiff) {
maxSize = maxDiff;
}
// 构造CIDR格式的IP段,并添加到结果列表中
String cidr = longToIP(start) + "/" + maxSize;
result.add(cidr);
// 移动到下一个子网
start += Math.pow(2, (32 - maxSize));
}
return result;
}
/**
* 将IPv4地址转换为长整型数字。
* 这个方法将IPv4地址字符串形式转换为它的二进制表示,并将这个二进制数表示为一个长整型数值。
* IPv4地址由4个8位的字节组成,这些字节由点号(.)分隔。
* 例如,地址"192.168.1.1"会被转换为数值3232235521。
*
* @param ipAddress 字符串形式的IPv4地址。
* @return 转换后的长整型数值。
*/
public static long ipToLong(String ipAddress) {
// 使用点号分割IP地址字符串,得到每个字节的字符串表示
String[] ipParts = ipAddress.split("\\.");
long result = 0;
// 遍历每个字节,将它们转换为整型,并按照IPv4的字节顺序组合成一个长整型数值
for (int i = 0; i < 4; i++) {
// 将每个字节转换为整型,并根据其在IP地址中的位置进行位移
// 位移的目的是将每个字节正确地放置在长整型数值的相应位置上
result += Integer.parseInt(ipParts[i]) << (24 - (8 * i));
}
return result;
}
/**
* 将一个长整型数值转换为IPv4地址字符串。
*
* @param ip 长整型数值表示的IP地址,每个字节占32位中的8位。
* @return 字符串表示的IPv4地址,形式为"xxx.xxx.xxx.xxx"。
*/
public static String longToIP(long ip) {
// 将ip的高8位转换为整型,并以字符串形式拼接
return ((ip >> 24) & 0xFF) + "." +
// 将ip的次高8位转换为整型,并以字符串形式拼接
((ip >> 16) & 0xFF) + "." +
// 将ip的中间8位转换为整型,并以字符串形式拼接
((ip >> 8) & 0xFF) + "." +
// 将ip的最低8位转换为整型,并以字符串形式拼接
(ip & 0xFF);
}
/**
* 根据CIDR值计算IPv4地址的子网掩码。
* <p>
* CIDR(Classless Inter-Domain Routing)是一种用于IPv4地址分配和子网划分的方法,它通过一个斜线后面的数字(CIDR值)来表示子网掩码的位数。
* 该方法接受一个CIDR值作为参数,返回对应子网掩码的长整型表示。如果CIDR值为0,则返回全0的子网掩码。
* <p>
* 计算子网掩码的原理是将32位的二进制数左移(32-CIDR)位,然后与全1的二进制数相与,得到子网掩码。
* 由于Java中没有直接处理二进制数的位运算操作符,因此使用按位左移和按位与操作来实现。
*
* @param cidr CIDR值,表示子网掩码中1的位数。
* @return 对应于给定CIDR值的子网掩码的长整型表示。
*/
public static long CIDRToMask(int cidr) {
// 当CIDR值为0时,返回全0的子网掩码
return cidr == 0 ? 0 : (0xFFFFFFFF << (32 - cidr));
}
}
输出
看看里面的格式
Nginx配置
Http
TCP
扩展
CIDR网段格式