现在电脑里的文档太多了,而且有一些是重复的。
这个小程序的目的就是找出这些重复的文档
现在已经完成了一些,就是制定某个目录,将该目录下所有的文件[不包括目录]信息保存到数据库中。
数据表fileinfo
{
filename
type
size
path
}
核心代码FileInfoCollector.java
/**
* 搜索路径path下的文件信息,并入库
*
*/
public boolean collect(String path) throws DBException
{
File file = new File(path);
File[] files = file.listFiles() ; //以后修改这里,使用一个FilenameFilter使得能够过滤一些不需要的文件,如html,gif
for(int i=0;i<files.length;i++)
{
File temp = files[i];
System.out.println("my name is "+temp.getName());
if(temp.isFile() )
{
//信息入库
addFileInfo(temp);
}
if(temp.isDirectory() )
{
//递归调用
collect(temp.getAbsolutePath() );
}
}
return true;
}//end collect
{
String filename = file.getName();
String path =file.getAbsolutePath();
String type=filename.substring( filename.lastIndexOf('.')+1,filename.length()); //根据文件名称,得到后缀
long size=file.length();
new FileInfoDao().add(filename,path,type,size);
return true;
}
当前进度:
已经可以将特定目录下文件信息入库,可以通过sql语句查看。
下一步打算:
写一个合适的sql语句,能够查看冗余文件。