有没有遇到过在数万条数据中查询数据的情况
查找一个数据的相关数据还行,那如果有十几个甚至更多的,一次一次的cv+ctrlF查询太费时费力。ctrlF只是查到包含此数据的条目,有些可能我们并不需要。
查到数据还需要我们cv拿出来。
我编写了一段代码实现了,输入Excel文件地址作为检索条件,被检索文件地址,检索结果传入地址。和匹配行的查询正则表达式(这个我是就我按当时情况来写的,具体情况需要具体分析)。
经过运行检索,会将符合的数据传入我们指定的文件中。
代码如下:
import org.apache.poi.ss.usermodel.*;
import java.io.*;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.*;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class ExcelTextSearch {
public static void main(String[] args) {
String excelFilePath = "C:\\Users\\Lenovo\\Desktop\\防火墙IP梳理清单.xlsx"; // Excel文件路径
String txtFilePath = "C:\\Users\\Lenovo\\Desktop\\yinxi_kafka_out0824-02.txt"; // 要检索的txt文件路径
String resultFilePath = "C:\\Users\\Lenovo\\Desktop\\ceshi.txt"; // 保存检索结果的新txt文件路径
Pattern pattern = Pattern.compile("\\b(?:\\d{1,3}\\.){3}\\d{1,3}\\b");
try (Workbook workbook = WorkbookFactory.create(Files.newInputStream(Paths.get(excelFilePath)));
BufferedWriter bw = new BufferedWriter(new FileWriter(resultFilePath))) {
Sheet sheet = workbook.getSheetAt(0); // 默认选择第一个工作表
// 读取Excel文件中的检索索引列数据
List<String> searchTerms = new ArrayList<>();
//选择第二行开始
for (int rowIndex = 1; rowIndex <= sheet.getLastRowNum(); rowIndex++) {
Row row = sheet.getRow(rowIndex);
Cell cell = row.getCell(1);
if (cell != null && cell.getCellType() == CellType.STRING) {
searchTerms.add(cell.getStringCellValue());
}
}
// 读取txt文件内容到内存中
List<String> txtLines = Files.readAllLines(Paths.get(txtFilePath));
// 在txt文件中检索并写入满足条件的行
StringBuilder resultBuilder = new StringBuilder();
for (String line : txtLines) {
//先遍历出一条日志数据
for (String searchTerm : searchTerms) {
//在从十几个目标ip里查找
if (line.contains(searchTerm)){
//如果包含就使用正则判断IP是否一致
Matcher matcher = pattern.matcher(line);
if (matcher.find()){
String s = matcher.group();
if (searchTerm.equals(s)){
//一致就把数据加进去
resultBuilder.append(line).append(System.lineSeparator());
}
break;
}
}
}
}
// 将结果写入到新的txt文件
bw.write(resultBuilder.toString());
} catch (IOException e) {
e.printStackTrace();
}
}
}
这是一个Java的test类,文件名称不是动态,后续我会开发为动态web网页版本。