目录
重名文件 加后缀重命名过滤实现
重名文件加后缀重命名过滤
如果存在重名,则在后面(扩展名的前面)加后缀 “_1”, “_2”, “_3”, … 直到文件名不重复为止,以此来确保文件名的唯一性。
实现
public class Main {
public static void main(String[] args) {
String originalFileName = "1232121421412(0).jpg";
Boolean repeat = true;
// 文件是否存在重名
StringBuilder fileName = new StringBuilder();
// 如果存在重名,则加_1后缀
if (repeat) {
int suffixNumber = 0;
String fileExtensionName = "";
// 分离文件拓展名(.jpg .png ... )
for (int i = originalFileName.length() - 1; i > 0; i--) {
if (originalFileName.charAt(i) == '.') {
fileExtensionName = originalFileName.substring(i, originalFileName.length());
fileName = new StringBuilder(originalFileName.substring(0, i));
break;
}
}
// 加_1后缀
fileName.append("_" + ++suffixNumber);
// 如果已经存在 _1 后缀,则改为 _2 , _3 ,...直到不重复为止
while (repeat) {
// 把我们添加的"_"后面所有数字字符删除
for (int length = fileName.length(); length > 0; length--) {
char c = fileName.charAt(length - 1);
if (c != '_') {
fileName.delete(length - 1, length);
}
else {
break;
}
}
fileName.append(++suffixNumber);
// 假设_23时不再重复
if ("23".equals(fileName.substring(fileName.length() - 2, fileName.length()))) {
break;
}
}
// 合并扩展名后返回
fileName.append(fileExtensionName);
System.out.println(fileName);
}
}
}
步骤概要:
- 定义原始文件名 originalFileName,并假设存在文件重名的情况(repeat 设置为 true)。
- 创建 StringBuilder 对象 fileName 用于存储新的文件名。代码找到原始文件名中的文件扩展名(如 .jpg、.png )。这通过从后向前遍历字符串,当遇到第一个.字符时截取扩展名并分离出来。
- 初始化一个整数变量 suffixNumber 用于存储后缀编号,初始值为0。
- 接下来开始处理重名问题。首先在文件名后添加 _1 后缀。
- 然后循环,检查新生成的文件名是否仍然存在重名。如果存在将继续增加后缀编号。
- 在循环中,首先删除之前添加的 _ 及其后面的所有数字字符。然后将 suffixNumber 加一,并重新添加到文件名后。
- 假设在某一时刻(如 “_23”),文件名不再重复,此时跳出循环。
- 将分离出来的文件扩展名添加回新的文件名。输出最终的新文件名。
运行
基于指数扩散二分搜索的重名文件重命名后缀
一般我们在重命名文件时可以发现是这种结构:
test.txt
test_1.txt
test_2.txt
或者是:
test.txt
test(1).txt
test(2).txt
前者是linux,后者是windows系统,但是不管什么系统,其核心逻辑都是通过在后缀中添加数字来实现的,首先可以想到的是数字应该从1开始计数(原文件则代表0),并且逐渐递增,我们先有线性搜索:
linearSearch
/**
* 线性查找
* @param originalFileName
* @return long
*/
public static long linearSearch(String originalFileName) {
long start = System.currentTimeMillis();
Boolean repeat = true;
// 如果存在重名,则加(1)后缀
if (repeat) {
StringBuilder fileName = new StringBuilder();
// 后缀数字初始化
int suffixNumber = 0;
String fileExtensionName = "";
// 分离文件拓展名(.jpg .png ... )
for (int i = originalFileName.length() - 1; i > 0; i--) {
if (originalFileName.charAt(i) == '.') {
fileExtensionName = originalFileName.substring(i, originalFileName.length());
fileName = new StringBuilder(originalFileName.substring(0, i));
break;
}
}
// 加_1后缀
fileName.append("_" + ++suffixNumber);
repeat = true;
// 如果已经存在 _1 后缀,则改为 _2 , _3 ,...直到不重复为止
while (repeat) {
// 把我们添加的"_"后面所有数字字符删除
for (int length = fileName.length(); length > 0; length--) {
char c = fileName.charAt(length - 1);
if (c != '_') {
fileName.delete(length - 1, length);
} else {
break;
}
}
// 在"_"后面添加++suffixNumber
fileName.append(++suffixNumber);
// 【重复判断】模拟O(n)的全图片集扫描
for (int i = 0; i < repeatNumberSize; i++) {
// 假设_repeatNumber时不再重复
if (repeatNumber.equals(fileName.substring(fileName.length() - repeatNumber.length(), fileName.length()))) {
repeat = false;
break;
}
}
// System.out.println(repeat + " " + fileName);
}
// 合并扩展名后返回
fileName.append(fileExtensionName);
System.out.println(fileName);
}
long end = System.currentTimeMillis();
return (end - start);
}
exponentialDiffusionBinarySearch
我们有指数扩散二分查找:
/**
* 指数扩散二分查找
* @param originalFileName
* @return long
*/
public static long exponentialDiffusionBinarySearch(String originalFileName) {
long start = System.currentTimeMillis();
Boolean repeat = true;
// 如果存在重名,则加(1)后缀
if (repeat) {
StringBuilder fileName = new StringBuilder();
// 后缀数字初始化
int suffixNumber = 0;
String fileExtensionName = "";
// 分离文件拓展名(.jpg .png ... )
for (int i = originalFileName.length() - 1; i > 0; i--) {
if (originalFileName.charAt(i) == '.') {
fileExtensionName = originalFileName.substring(i, originalFileName.length());
fileName = new StringBuilder(originalFileName.substring(0, i));
break;
}
}
// 加_1后缀
fileName.append("_" + ++suffixNumber);
repeat = true;
int left = 1;
int mid = 1;
int right = 2;
boolean rightFind = repeat;
// 1.指数扩散,右边界扩散至无目标区
while (rightFind) {
// 左边界跟进,缩小范围
left = mid;
// 右边界指数扩张,继续搜索
right = right * 2;
// 二分法试探
mid = (left + right) / 2;
// 【判断重复】假设_right下标不再重复
if (repeatNumberSize < right) {
rightFind = false;
}
}
// 【判断重复】
repeat = (mid < repeatNumberSize) ? true : false;
// 2.二分查找
while (repeat.equals(Boolean.TRUE) || left < right) {
// 把我们添加的"_"后面所有数字字符删除
for (int length = fileName.length(); length > 0; length--) {
char c = fileName.charAt(length - 1);
if (c != '_') {
fileName.delete(length - 1, length);
} else {
break;
}
}
if (repeat) {
// 左边界跟进,缩小范围
left = mid + 1;
}
else {
// 右边界收回,缩小范围
right = mid;
}
// 二分法试探
mid = (left + right) / 2;
// 在"_"后面添加 mid
fileName.append(mid);
// 模拟O(n)的全图片集扫描,【判断重复】
for (int i = 0; i < repeatNumberSize; i++) {
// 假设_repeatNumber时不再重复
if (mid < repeatNumberSize) {
repeat = true;
break;
}
else if (repeatNumberSize <= mid) {
repeat = false;
break;
}
}
// System.out.println(repeat + " " + fileName);
}
// 合并扩展名后返回
fileName.append(fileExtensionName);
System.out.println(fileName);
}
long end = System.currentTimeMillis();
return (end - start);
}
代码概要:
- 假设存在文件重名的情况:将布尔变量 repeat 设置为 true。
- 如果存在重名,执行以下操作:初始化一个 StringBuilder 对象 fileName。初始化后缀数字 suffixNumber 为0。
- 找到原始文件名中的文件扩展名,并将其存储在 fileExtensionName 中。在文件名后添加 (1) 后缀。
- 初始化二分查找的相关变量:left、mid 和 right 分别设置为1,rightFind 设置为 repeat 的值。
- 使用指数扩散的方法来确定右边界:在循环中,每次都将右边界扩大两倍(right *= 2)。使用二分法更新 mid 的值。
- 检查是否找到了无目标区域(即不存在重复的后缀),如果找到,则跳出循环。
- 判断是否存在重复后缀:根据 mid 和 repeatNumberSize 的关系来判断是否存在重复。如果存在重复,将 repeat 设置为 true,否则设置为 false。使用二分查找来寻找唯一的后缀编号:
- 在循环中,根据 repeat 的值更新左边界或右边界。更新 mid 的值。删除之前添加的 _ 及其后面的所有数字字符。在文件名后添加 mid。
- 模拟全图片集扫描的过程,检查是否存在重复后缀。
- 如果找到重复后缀,将 repeat 设置为 true,否则设置为 false。
- 循环结束时,将分离出来的文件扩展名添加回新的文件名,并输出结果。
- 使用 System.currentTimeMillis() 获取当前时间并存储在变量 end 中。返回处理过程所花费的时间:计算 end 和 start 之间的差值并返回。
实现
ExponentialDiffusionBinarySearch.java
总的代码实现和demo有:
/**
* 基于指数扩散二分查找的重名文件搜索
* @author
*/
public class ExponentialDiffusionBinarySearch {
public static String repeatNumber = "200";
public static int repeatNumberSize = Integer.parseInt(repeatNumber);
public static String originalFileName = "1232121421412(0).jpg";
/**
* 线性查找
* @param originalFileName
* @return long
*/
public static long linearSearch(String originalFileName) {
long start = System.currentTimeMillis();
Boolean repeat = true;
// 如果存在重名,则加(1)后缀
if (repeat) {
StringBuilder fileName = new StringBuilder();
// 后缀数字初始化
int suffixNumber = 0;
String fileExtensionName = "";
// 分离文件拓展名(.jpg .png ... )
for (int i = originalFileName.length() - 1; i > 0; i--) {
if (originalFileName.charAt(i) == '.') {
fileExtensionName = originalFileName.substring(i, originalFileName.length());
fileName = new StringBuilder(originalFileName.substring(0, i));
break;
}
}
// 加_1后缀
fileName.append("_" + ++suffixNumber);
repeat = true;
// 如果已经存在 _1 后缀,则改为 _2 , _3 ,...直到不重复为止
while (repeat) {
// 把我们添加的"_"后面所有数字字符删除
for (int length = fileName.length(); length > 0; length--) {
char c = fileName.charAt(length - 1);
if (c != '_') {
fileName.delete(length - 1, length);
} else {
break;
}
}
// 在"_"后面添加++suffixNumber
fileName.append(++suffixNumber);
// 【重复判断】模拟O(n)的全图片集扫描
for (int i = 0; i < repeatNumberSize; i++) {
// 假设_repeatNumber时不再重复
if (repeatNumber.equals(fileName.substring(fileName.length() - repeatNumber.length(), fileName.length()))) {
repeat = false;
break;
}
}
// System.out.println(repeat + " " + fileName);
}
// 合并扩展名后返回
fileName.append(fileExtensionName);
System.out.println(fileName);
}
long end = System.currentTimeMillis();
return (end - start);
}
/**
* 指数扩散二分查找
* @param originalFileName
* @return long
*/
public static long exponentialDiffusionBinarySearch(String originalFileName) {
long start = System.currentTimeMillis();
Boolean repeat = true;
// 如果存在重名,则加(1)后缀
if (repeat) {
StringBuilder fileName = new StringBuilder();
// 后缀数字初始化
int suffixNumber = 0;
String fileExtensionName = "";
// 分离文件拓展名(.jpg .png ... )
for (int i = originalFileName.length() - 1; i > 0; i--) {
if (originalFileName.charAt(i) == '.') {
fileExtensionName = originalFileName.substring(i, originalFileName.length());
fileName = new StringBuilder(originalFileName.substring(0, i));
break;
}
}
// 加_1后缀
fileName.append("_" + ++suffixNumber);
repeat = true;
int left = 1;
int mid = 1;
int right = 2;
boolean rightFind = repeat;
// 1.指数扩散,右边界扩散至无目标区
while (rightFind) {
// 左边界跟进,缩小范围
left = mid;
// 右边界指数扩张,继续搜索
right = right * 2;
// 二分法试探
mid = (left + right) / 2;
// 【判断重复】假设_right下标不再重复
if (repeatNumberSize < right) {
rightFind = false;
}
}
// 【判断重复】
repeat = (mid < repeatNumberSize) ? true : false;
// 2.二分查找
while (repeat.equals(Boolean.TRUE) || left < right) {
// 把我们添加的"_"后面所有数字字符删除
for (int length = fileName.length(); length > 0; length--) {
char c = fileName.charAt(length - 1);
if (c != '_') {
fileName.delete(length - 1, length);
} else {
break;
}
}
if (repeat) {
// 左边界跟进,缩小范围
left = mid + 1;
}
else {
// 右边界收回,缩小范围
right = mid;
}
// 二分法试探
mid = (left + right) / 2;
// 在"_"后面添加 mid
fileName.append(mid);
// 模拟O(n)的全图片集扫描,【判断重复】
for (int i = 0; i < repeatNumberSize; i++) {
// 假设_repeatNumber时不再重复
if (mid < repeatNumberSize) {
repeat = true;
break;
}
else if (repeatNumberSize <= mid) {
repeat = false;
break;
}
}
// System.out.println(repeat + " " + fileName);
}
// 合并扩展名后返回
fileName.append(fileExtensionName);
System.out.println(fileName);
}
long end = System.currentTimeMillis();
return (end - start);
}
public static void main(String[] args) {
long time1 = linearSearch(originalFileName);
System.out.println("linearSearch 运行时间:" + time1 + "(ms)");
long time2 = exponentialDiffusionBinarySearch(originalFileName);
System.out.println("exponentialDiffusionBinarySearch 运行时间:" + time2 + "(ms)");
}
}
运行
运行结果如下,可以看到同样是从0搜索到200的后缀名,线性搜索的重名文件重命名后缀运行耗时32ms,指数扩散二分搜索的的重名文件重命名后缀则耗时0ms,非常迅速。