删除文件中重复的行

原创 2005年03月01日 16:53:00

删除文件中重复的行

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

实际上是一个很简单的操作,在这里写出来是因为最近在看Thinking in C++ Volume 2中关于iostream的章节,当作练习吧,所以写出来。J

 

 

 

 

 

 

 

 

 

 

 

 

 

先定义常量

 

 

 

 

 

 

 

 

 

const int UNIQUE_LINES_OK = 0;

 

 

 

 

 

 

 

 

 

const int UNIQUE_LINES_ERROR = 1;

 

 

 

 

 

 

 

 

 

const int FILE_OPEN_ERROR = 2;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

以下函数int ULISF(const string &strFileName)即是所用到的函数,其中

 

 

 

 

 

 

 

 

 

参数 const string &strFileName 是 文件的名称;

 

 

 

 

 

 

 

 

 

返回值

 

 

 

 

 

 

 

 

 

UNIQUE_LINES_OK:    删除文件中重复的行执行成功;

 

 

 

 

 

 

 

 

 

 UNIQUE_LINES_ERROR: 写入文件错误;

 

 

 

 

 

 

 

 

 

 FILE_OPEN_ERROR:    文件打开失败。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

函数如下:

 

 

 

 

 

 

 

 

 

int ULISF(const string &strFileName)

 

 

 

 

 

 

 

 

 

{

 

 

 

 

 

 

 

 

 

    int iRet = UNIQUE_LINES_OK;

 

 

 

 

 

 

 

 

 

   

 

 

 

 

 

 

 

 

 

    set<string> setStrLines;   // the string set

 

 

 

 

 

 

 

 

 

    string strReadLine;        // temporary string read from the file   

 

 

 

 

 

 

 

 

 

   

 

 

 

 

 

 

 

 

 

// read each lines from the file  -- Begin --   

 

 

 

 

 

 

 

 

 

    ifstream fIn(strFileName.c_str()); // read the file

 

 

 

 

 

 

 

 

 

    if(!fIn)                         // verify open

 

 

 

 

 

 

 

 

 

    {

 

 

 

 

 

 

 

 

 

        iRet = FILE_OPEN_ERROR;

 

 

 

 

 

 

 

 

 

        return iRet;

 

 

 

 

 

 

 

 

 

    }

 

 

 

 

 

 

 

 

 

 

 

         

 

 

           while(getline(fIn,strReadLine))

 

 

 

 

 

 

 

 

    {

 

 

 

 

 

 

 

 

 

        setStrLines.insert(strReadLine);

 

 

 

 

 

 

 

 

 

    }

 

 

 

 

 

 

 

 

 

    fIn.close();     

 

 

 

 

 

 

 

 

 

// read each lines from the file  -- End --       

 

 

 

 

 

 

 

 

 

  

  

 

  

 

// delete the file

 

 

 

 

 

 

 

 

 

    remove(strFileName.c_str());

 

 

 

 

 

 

 

 

 

  

 

 

 

 

 

 

 

 

 

// write the strings of the set into the file -- Begin --

 

 

 

 

 

 

 

 

 

    ofstream fOut(strFileName.c_str()); // write the file  

 

 

 

 

 

 

 

 

 

    if(!fOut)                           // verify open

 

 

 

 

 

 

 

 

 

    {

 

 

 

 

 

 

 

 

 

        iRet = FILE_OPEN_ERROR;

 

 

 

 

 

 

 

 

 

        return iRet;

 

 

 

 

 

 

 

 

 

    }

 

 

 

 

 

 

 

 

 

   

 

 

 

 

 

 

 

 

 

    set<string>::iterator it;

 

 

 

 

 

 

 

 

 

    for(it = setStrLines.begin(); it != setStrLines.end(); it ++)

 

 

 

 

 

 

 

 

 

    {

 

 

 

 

 

 

 

 

 

        fOut << it->c_str() << endl;

 

 

 

 

 

 

 

 

 

    }   

 

 

 

 

 

 

 

 

 

    fOut.close();

 

 

 

 

 

 

 

 

 

// write the strings of the set into the file -- End --

 

 

 

 

 

 

 

 

 

   

 

 

 

 

 

 

 

 

 

    return iRet;

 

 

 

 

 

 

 

 

 

}

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

由于用到C++标准库中的文件,因为还需要加上头文件

 

 

 

 

 

 

 

 

 

#include <iostream>

 

 

 

 

 

 

 

 

 

#include <string>

 

 

 

 

 

 

 

 

 

#include <set>

 

 

 

 

 

 

 

 

 

#include <fstream>

 

 

 

 

 

 

 

 

 

#include <iterator>

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(完)

 

 

 

 

 

 

 

 

 

重复文件删除器

  • 2017年10月26日 17:33
  • 88KB
  • 下载

删除重复文件

  • 2013年07月02日 00:14
  • 540KB
  • 下载

Webpack 删除重复文件的一种优化思路

clean-webpack-plugin 删除重复文件的一种优化思路

重复文件删除工具Mac OS X (X86)

  • 2013年02月02日 15:47
  • 116KB
  • 下载

重复文件删除工具64位Unicode版

  • 2013年02月02日 15:41
  • 80KB
  • 下载

shell脚本实现查找文件夹下重复的文件,并提供删除功能

Windows下有软件FindDupFile,可以搜索指定目录及其下子目录,列出所有内容完全相同的文件(文件名可能不同),然后由用户选择删除重复的文件。 然而shell脚本却可以使用几行的命令完成与此...
  • kinado
  • kinado
  • 2013年07月31日 22:35
  • 5800

DoubleKiller重复文件删除

  • 2009年06月04日 19:39
  • 323KB
  • 下载

使用python删除本地夹里重复的文件

上次的博文主要说了从网上下载图片,于是我把整个笑话网站的图片都拔下来了,但是在拔取的图片中有很多重复的,比如说页面的其他图片、重复发布的图片等等。所以我又找了python的一些方法,写了一个脚本可以删...
  • CCGGAAG
  • CCGGAAG
  • 2017年06月06日 12:57
  • 592
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:删除文件中重复的行
举报原因:
原因补充:

(最多只允许输入30个字)