文件分割和合并多线程实现

     用途:像一些安装程序经常会用到的是把一个很大的文件切割成较小的文件,安装的时候从每个小的文件块中读取内容。还有一些网络下载工具像快车等一般是通过多线程对同一个文件进行下载,就是对同一文件进行分块下载,然后将本地的文件块合并就可以得到最终的文件,提高了效率。

    其实文件分割和合并的方法就是自定义的一个数据结构,通过数据结构获得文件信息以进行操作。在这里我们整体过程是这样的:

    ---------------                  ------------------

    中间文件1     ---  >>>  文件信息头

    ---------------                  源文件内容

    中间文件2                    ------------------

            ...

            ...

     --------------

     中间文件n

 

文件信息头是自定义的结构,在这里我们定义成这样:

typedef struct tagTHREADSECT
{
    TCHAR cFilename[40];    // 被分割的文件名.
    DWORD nFileSize;          // 文件长度.
    DWORD nNumber;          // 总分割数.
    DWORD nNo;                  // 子文件序号.
    DWORD nStart;               // 分割的起始位置.
    DWORD nEnd;                // 分割的起始位置.
} THREADSECT;

首先包含被分割或合并的源文件名,再有文件长度,文件总分割数和子文件序号,这些可以用于验证分割或合并的完成性。最后两个为此块文件包含源文件的内容,在源文件中的起始位置信息。

 

好了现在说一说实现,就分割而言可以按固定大小或固定数目两个种分割方法。两种方法只有分的块数不同其他实现基本一样。接着就是分割或合并,在这里我们可以使用多线程实现对每一块文件的操作提高效率,所以需要两个线程一个负责分割另一个负责合并。使用到多线程对同一文件的操作则还需要考虑对文件的保护,可以使用关键区域加锁方法实现。

 

再需要定义一个结构体或类:CSectInfo

包含:文件目录 (CString) 信息头 (THREADSECT) 和 文件指针(FILE*)

此模块可以用来向进程传送数据,进程通过此模块就可以进行独立的操作。

文件目录用来保证文件位置,信息头包含了分块信息,文件指针则保存了源文件指针,以便在进程里对源文件进行操作。

 

下面是代码,对文件的分割和合并都封装到一个CThreadFCut类里:

  1. // ThreadFCut.h: 定义CThreadFCut类.
  2. #ifndef _THREADFCUT_H__INCLUDED
  3. #define _THREADFCUT_H__INCLUDED
  4. #include <sys/stat.h>  // 加入状态显示头文件.
  5. #define MCHAR(str)    (str.GetBuffer(str.GetLength()))
  6. typedef struct tagTHREADSECT
  7. {
  8.     TCHAR cFilename[40];    // 被分割的文件名.
  9.     DWORD nFileSize;        // 文件长度. 
  10.     DWORD nNumber;          // 总分割数.
  11.     DWORD nNo;              // 子文件序号.
  12.     DWORD nStart;           // 分割的起始位置.
  13.     DWORD nEnd;             // 分割的起始位置.
  14. } THREADSECT;
  15. class CSectInfo
  16. {
  17. public:
  18.     CString strFilePath;    // 分割后的文件保存目录.
  19.     THREADSECT sect;        // 分割的起始和终止位置.
  20.     FILE * fp;              // 文件指针.
  21. };
  22. class CThreadFCut  
  23. {
  24. public:
  25.     CThreadFCut();
  26.     virtual ~CThreadFCut();
  27. public:
  28.     //等数目的分割
  29.     BOOL DoVolumeCut(CString strCurrDir,CString strSaveDir, CString strFileName,int nSectNum);
  30.     //等体积的分割
  31.     BOOL DoUnitCut(CString strCurrDir,CString strSaveDir, CString strFileName,long nSize);
  32.     //线程合并                           
  33.     BOOL DoThreadCombine(CString strCurrDir,CString strSaveDir, CString strFileName, int nSectNum);
  34.     //非线程合并                           
  35.     BOOL NonThreadCombine(CString strCurrDir,CString strSaveDir,CString strFileName,int nSectNum);
  36.     //判断文件是否存在                    
  37.     BOOL FileExists(LPCTSTR lpszFileName);
  38.     //检查是否为分割后的块文件
  39.     BOOL CheckFile(CString &strFileName,int &nSectNum);
  40.     //实现自动合并
  41.     void DoSelfBind();
  42.     //分割文件路径
  43.     void BreakFileName(CString strFileName,CString &strPath, CString &strShortName);
  44. private:
  45.     //线程和主线程共享的数据块
  46.     CSectInfo *sectinfo;
  47. protected:
  48.     //合并线程
  49.     static UINT ThreadFileCombine(void* pParam);
  50.     //分割线程
  51.     static UINT ThreadFileCut(void* pParam);
  52.     //实现加锁保护
  53.     static CRITICAL_SECTION m_csDataLock;
  54.     //分割文件块计数
  55.     static int m_nCount;
  56. };
  57. #endif 

下面是实现:

 

  1. // FThreadFCut.cpp: 实现CThreadFCut类.
  2. //
  3. #include "stdafx.h"
  4. #include "ThreadFCut.h"
  5. CRITICAL_SECTION CThreadFCut::m_csDataLock;
  6. int CThreadFCut::m_nCount=0;
  7. //---------------------------------------------------------------------------
  8. CThreadFCut::CThreadFCut()
  9. {
  10.     InitializeCriticalSection(&CThreadFCut::m_csDataLock);
  11. }
  12. //---------------------------------------------------------------------------
  13. CThreadFCut::~CThreadFCut()
  14. {
  15.     DeleteCriticalSection(&CThreadFCut::m_csDataLock);
  16. }
  17. //---------------------------------------------------------------------------
  18. BOOL CThreadFCut::FileExists(LPCTSTR lpszFileName)
  19. {
  20.     DWORD dwAttributes = GetFileAttributes(lpszFileName);
  21.     if (dwAttributes == 0xFFFFFFFF)
  22.         return FALSE;
  23.     if ((dwAttributes & FILE_ATTRIBUTE_DIRECTORY) 
  24.          == FILE_ATTRIBUTE_DIRECTORY)
  25.     {
  26.             return FALSE;
  27.     }
  28.     else
  29.     {
  30.         return TRUE;
  31.     }
  32. }
  33. //---------------------------------------------------------------------------
  34. // 用多线程对文件进行分割的线程控制函数.
  35. UINT CThreadFCut::ThreadFileCut(void* pParam)
  36. {
  37.     CSectInfo *pInfo=(CSectInfo*)pParam;
  38.     char *buffer;
  39.     FILE *fpwrite;
  40.     DWORD nSize;
  41.     // 建立子文件名.
  42.     CString strChildFileName;
  43.     strChildFileName.Format("%s_%d",pInfo->strFilePath+
  44.               pInfo->sect.cFilename,pInfo->sect.nNo);
  45.     // 打开子文件.
  46.     if((fpwrite=fopen(strChildFileName,"wb"))==NULL){
  47.             return 1;
  48.     }
  49.     // 设置文件写指针起始位置.
  50.     fseek(fpwrite,0,SEEK_SET);
  51.     
  52.     // 写分割信息.
  53.     fwrite(&pInfo->sect,1,sizeof(THREADSECT),fpwrite);
  54.     DWORD nPos=pInfo->sect.nStart;
  55.     nSize =pInfo->sect.nEnd-nPos;
  56.     buffer= new char[nSize];
  57.     // 设置文件读指针起始位置.
  58.     fseek(pInfo->fp,nPos,SEEK_SET);
  59.     // 把读出文件数据.     
  60.     fread(buffer,1,nSize,pInfo->fp);
  61.     
  62.     // 把读出的文件数据写入到子文件.      
  63.     fwrite(buffer,1,nSize,fpwrite);
  64.     
  65.     delete[] buffer;
  66.     // 关闭写文件.
  67.     fclose(fpwrite);
  68.     // 计数.
  69.     CThreadFCut::m_nCount++;
  70.     return 0;
  71. }
  72. //---------------------------------------------------------------------------
  73. // 用多线程对分割文件进行合并的线程控制函数.
  74. UINT CThreadFCut::ThreadFileCombine(void* pParam)
  75. {
  76.     CSectInfo *pInfo=(CSectInfo*)pParam;
  77.     char *buffer;
  78.     FILE *fpread;
  79.     DWORD nSize;
  80.    
  81.     THREADSECT fileHead;
  82.     
  83.     // 建立子文件名.
  84.     CString strChildFileName;
  85.     strChildFileName.Format("%s_%d",pInfo->strFilePath+
  86.                   pInfo->sect.cFilename, pInfo->sect.nNo);
  87.     // 打开读文件(子文件).
  88.     if((fpread=fopen(strChildFileName,"rb"))==NULL){    
  89.          return 1;
  90.     }
  91.     // 把文件读指针放在文件头.
  92.     fseek(fpread,0,SEEK_SET);
  93.     
  94.     // 读分割信息.
  95.     fread(&fileHead,1,sizeof(THREADSECT),fpread);
  96.     
  97.     // 检验文件序号是否正确.
  98.     if(fileHead.nNo!=pInfo->sect.nNo){
  99.         return 1;
  100.     }
  101.     // 设置文件读指针起始位置.
  102.     fseek(fpread,sizeof(THREADSECT),SEEK_SET);
  103.     DWORD nPos=fileHead.nStart;
  104.     nSize =fileHead.nEnd-nPos;
  105.     buffer= new char[nSize];
  106.     // 把读出子文件数据.        
  107.     fread(buffer,1,nSize,fpread);
  108.     // 保护合并文件.
  109.     EnterCriticalSection(&CThreadFCut::m_csDataLock);
  110.     // 设置文件写指针起始位置.
  111.     fseek(pInfo->fp,nPos,SEEK_SET);
  112.     // 把文件数据写入到合并文件.        
  113.     fwrite(buffer,1,nSize,pInfo->fp);
  114.     LeaveCriticalSection(&CThreadFCut::m_csDataLock);
  115.     
  116.     delete[] buffer;
  117.     // 关闭读文件.
  118.     fclose(fpread);
  119.     // 计数.
  120.     CThreadFCut::m_nCount++;
  121.     return 0;
  122. }
  123. //---------------------------------------------------------------------------
  124. // 实现等体积的文件分割.
  125. BOOL CThreadFCut::DoVolumeCut(CString strCurrDir,CString strSaveDir, 
  126.                         CString strFileName, int nSectNum)
  127. {
  128.     CString strCurrFile=strCurrDir+strFileName;
  129.      
  130.     if(!FileExists(strCurrFile)) return FALSE;
  131.     ASSERT(nSectNum>1);
  132.     ASSERT(!strCurrFile.IsEmpty());
  133.     struct _stat ST; 
  134.     FILE *fpread;
  135.     // 获取文件长度.
  136.     _stat(strCurrFile, &ST);
  137.     UINT nFilesize=ST.st_size;
  138.     // 计算分割段的大小.
  139.     DWORD nSize = nFilesize/nSectNum;
  140.     // 把计数器清零.
  141.     m_nCount=0;
  142.     // 打开文件,被切割的文件名.
  143.     if((fpread=fopen(strCurrFile,"rb"))==NULL){
  144.         return FALSE;
  145.     }
  146.     // 给每个线程的信息结构申请内存.
  147.     sectinfo=new CSectInfo[nSectNum];
  148.     // 创建线程.
  149.     for(int i=0;i<nSectNum;i++)
  150.     {
  151.         sectinfo[i].fp=fpread;
  152.         sectinfo[i].strFilePath = strSaveDir;
  153.         strcpy(sectinfo[i].sect.cFilename,MCHAR(strFileName));
  154.         sectinfo[i].sect.nFileSize=nFilesize;
  155.         sectinfo[i].sect.nNumber=nSectNum;
  156.         sectinfo[i].sect.nNo=i;
  157.         if(i<nSectNum-1){
  158.             sectinfo[i].sect.nStart=i*nSize;
  159.             sectinfo[i].sect.nEnd=(i+1)*nSize;
  160.         }
  161.         else{
  162.             sectinfo[i].sect.nStart=i*nSize;
  163.             sectinfo[i].sect.nEnd=nFilesize;
  164.         }
  165.         
  166. #ifdef _DEBUG
  167.         TRACE("Starting and ending pos for the section: %d %d %d/n",
  168.                 i,sectinfo[i].sect.nStart,sectinfo[i].sect.nEnd);
  169. #endif //_DEBUG
  170.         AfxBeginThread(ThreadFileCut,§info[i],THREAD_PRIORITY_HIGHEST);
  171.     }
  172.     // 等待所有线程结束.
  173.     while(m_nCount!=nSectNum) Sleep(5);
  174.     delete[] sectinfo;
  175.     fclose(fpread);
  176.     
  177.     // 删除被分割文件.
  178.     DeleteFile(strCurrFile);
  179.     return TRUE;
  180. }
  181. //---------------------------------------------------------------------------
  182. // 实现等单位的文件分割.
  183. BOOL CThreadFCut::DoUnitCut(CString strCurrDir,CString strSaveDir, CString strFileName, long nSize)
  184. {
  185.     CString strCurrFile=strCurrDir+strFileName;
  186.     if(!FileExists(strCurrFile)) return FALSE;
  187.     ASSERT(nSize>1);
  188.     ASSERT(!strCurrFile.IsEmpty());
  189.     struct _stat ST; 
  190.     FILE *fpread;
  191.     // 获取文件长度.
  192.     _stat(strCurrFile, &ST);
  193.     UINT nFilesize=ST.st_size;
  194.     // 计算分割段的段数.
  195.     int nSectNum= nFilesize/nSize;
  196.     // 有多余的长度.
  197.     if(nFilesize%nSize!=0) nSectNum ++;
  198.     
  199.     // 把计数器清零.
  200.     m_nCount=0;
  201.     // 打开文件,被切割的文件名.
  202.     if((fpread=fopen(strCurrFile,"rb"))==NULL){
  203.         return FALSE;
  204.     }
  205.     // 给每个线程的信息结构申请内存.
  206.     sectinfo=new CSectInfo[nSectNum];
  207.     // 创建线程.
  208.     for(int i=0;i<nSectNum;i++)
  209.     {
  210.         sectinfo[i].fp=fpread;
  211.         sectinfo[i].strFilePath = strSaveDir;
  212.         strcpy(sectinfo[i].sect.cFilename,MCHAR(strFileName)); 
  213.         sectinfo[i].sect.nFileSize=nFilesize;
  214.         sectinfo[i].sect.nNumber=nSectNum;
  215.         sectinfo[i].sect.nNo=i;
  216.         if(i<nSectNum-1){
  217.             sectinfo[i].sect.nStart=i*nSize;
  218.             sectinfo[i].sect.nEnd=(i+1)*nSize;
  219.         }
  220.         else{
  221.             sectinfo[i].sect.nStart=i*nSize;
  222.             sectinfo[i].sect.nEnd=nFilesize;
  223.         }
  224.         
  225. #ifdef _DEBUG
  226.         TRACE("Starting and ending pos for the section: %d %d %d/n",
  227.                 i,sectinfo[i].sect.nStart,sectinfo[i].sect.nEnd);
  228. #endif //_DEBUG
  229.         AfxBeginThread(ThreadFileCut,§info[i],THREAD_PRIORITY_HIGHEST);
  230.     }
  231.     // 等待所有线程结束.
  232.     while(m_nCount!=nSectNum) Sleep(5);
  233.     
  234.     delete[] sectinfo;
  235.     fclose(fpread);
  236.     // 删除被分割文件.
  237.     DeleteFile(strCurrFile);
  238.     
  239.     return TRUE;
  240. }
  241. //---------------------------------------------------------------------------
  242. // 用多线程对被分割文件还原.
  243. BOOL CThreadFCut::DoThreadCombine(CString strCurrDir,CString strSaveDir, 
  244.                         CString strFileName, int nSectNum)
  245. {
  246.     CString strSaveFile=strSaveDir+strFileName;
  247.     CString strCurrFile=strCurrDir+strFileName;
  248.     CString strChildFileName;
  249.     strChildFileName.Format("%s_0",strCurrFile);
  250.     if(!FileExists(strChildFileName))
  251.         return FALSE;
  252.     
  253.     FILE *fpwrite;
  254.     
  255.     // 把计数器清零.
  256.     m_nCount=0;
  257.     
  258.     // 打开文件,应为切割前的文件名.
  259.     if((fpwrite=fopen(strSaveFile,"wb"))==NULL){
  260.         return FALSE;
  261.     }
  262.     //给每个线程的信息结构申请内存.
  263.     sectinfo=new CSectInfo[nSectNum];
  264.     for(int i=0;i<nSectNum;i++)
  265.     {
  266.         sectinfo[i].fp=fpwrite;
  267.         sectinfo[i].strFilePath = strCurrDir;
  268.         strcpy(sectinfo[i].sect.cFilename,MCHAR(strFileName)); 
  269.     
  270.         sectinfo[i].sect.nNo=i;
  271.         AfxBeginThread(ThreadFileCombine,§info[i],THREAD_PRIORITY_HIGHEST);
  272.     }
  273.     // 等待所有线程结束.
  274.     while(m_nCount!=nSectNum) Sleep(5);
  275.     for(int i=0;i<nSectNum;i++){
  276.         strChildFileName.Format("%s_%d",strCurrFile,i);
  277.         DeleteFile(strChildFileName);
  278.     }
  279.     delete[] sectinfo;
  280.     fclose(fpwrite);
  281.     return TRUE;
  282. }
  283. //---------------------------------------------------------------------------
  284. // 没有采用多线程时对分割后文件的合并.
  285. BOOL CThreadFCut::NonThreadCombine(CString strCurrDir,CString strSaveDir,
  286.                                    CString strFileName,int nSectNum)
  287. {   
  288.     CString strSaveFile=strSaveDir+strFileName;
  289.     CString strCurrFile=strCurrDir+strFileName;
  290.     THREADSECT fileHead;
  291.     FILE *fpread, *fpwrite;
  292.     CString strChildFileName; 
  293.     // 打开文件,应为切割前的文件名.
  294.     if((fpwrite=fopen(strSaveFile,"wb"))==NULL){
  295.         return FALSE;
  296.     }
  297.     for(int i=0;i<nSectNum;i++)
  298.     {
  299.         strChildFileName.Format("%s_%d",strCurrFile,i);
  300.         if(!FileExists(strChildFileName)) return FALSE;
  301.     
  302.         // 打开文件.
  303.         if((fpread=fopen(strChildFileName,"rb"))==NULL)
  304.             return FALSE;
  305.         // 把文件读指针放在文件头.
  306.         fseek(fpread,0,SEEK_SET);
  307.     
  308.         // 读分割信息.
  309.         fread(&fileHead,1,sizeof(THREADSECT),fpread);
  310.         // 获得写入数据时文件的起始位置.
  311.         DWORD nPos=fileHead.nStart;
  312.         
  313.         // 设置文件写指针起始位置.
  314.         fseek(fpwrite,nPos,SEEK_SET);
  315.         int c;
  316.         // 把文件数据写入到子文件.     
  317.         while((c=fgetc(fpread))!=EOF)
  318.         {
  319.             fputc(c,fpwrite);
  320.             nPos++;
  321.             if(nPos==fileHead.nEnd) break;
  322.         }
  323.         fclose(fpread);
  324.         DeleteFile(strChildFileName);
  325.     }
  326.     fclose(fpwrite);
  327.     return TRUE;
  328. }
  329. //---------------------------------------------------------------------------
  330. // 获得分割后文件的信息.
  331. BOOL CThreadFCut::CheckFile(CString & strFileName,int &nSectNum)
  332. {
  333.     THREADSECT fileHead;
  334.     FILE *fp;
  335.     // 从一个子文件中获得分割文件的信息.
  336.     // 打开文件.
  337.     if((fp=fopen(strFileName,"rb"))==NULL)
  338.         return FALSE;
  339.     struct _stat ST; 
  340.     // 读文件头.
  341.     fread(&fileHead,1,sizeof(THREADSECT),fp);
  342.     fclose(fp);
  343.     // 获取文件长度.
  344.     _stat(strFileName, &ST);
  345.     UINT nFilesize=ST.st_size;
  346.     // 获得被分割的文件名.
  347.     strFileName = fileHead.cFilename;
  348.     
  349.     // 获得分割段数.
  350.     nSectNum=fileHead.nNumber;
  351.     // 由保存的THREADSECT计算文件长度.
  352.     UINT nFilesizeA =(fileHead.nEnd-fileHead.nStart)+sizeof(THREADSECT);
  353.     // 文件校验.
  354.     if(nFilesizeA==nFilesize) return TRUE;
  355.     return FALSE;
  356. }
  357. //---------------------------------------------------------------------------
  358. // 实现被分割文件的自身合并.
  359. void CThreadFCut::DoSelfBind()
  360. {
  361.     CFileFind finder;
  362.     TCHAR szDir[MAX_PATH];
  363.     // 获得文件的当前目录.
  364.     GetCurrentDirectory(MAX_PATH, szDir);  
  365.     
  366.     CString strFileName;
  367.     int nSectNum;
  368.     BOOL bWorking = finder.FindFile(CString(szDir)+"//*");
  369.     BOOL bFind=FALSE;
  370.     while (bWorking)
  371.     {
  372.         bWorking = finder.FindNextFile();
  373.     
  374.         // 判别是否为目录.
  375.         if(!finder.IsDirectory()){
  376.             CString strTempName=finder.GetFilePath();
  377.             if(CheckFile(strTempName,nSectNum)){
  378.                 strFileName=strTempName;
  379.                 bFind=TRUE;
  380.                 break;
  381.             }
  382.         }
  383.     }
  384.     // 没有找到分割后的子文件.
  385.     if(!bFind){
  386.        AfxMessageBox("Fail to find any splitted file!");
  387.        return;
  388.     }
  389.     CString strFilePath,strShortFileName;
  390.     
  391.     // 分离文件路径和短文件名.
  392.     BreakFileName(strFileName,strFilePath,strShortFileName);
  393.     // 也可以用多线程法对文件合并:
  394. //   DoThreadCombine(strFilePath,strFilePath,strShortFileName,nSectNum);
  395.     NonThreadCombine(strFilePath,strFilePath,strShortFileName,nSectNum);
  396. };
  397. //---------------------------------------------------------------------------
  398. // 把全程文件名分解成文件路径和短文件名.
  399. void CThreadFCut::BreakFileName(CString strFileName,
  400.                    CString &strPath, CString &strShortName)
  401. {
  402.     // 分离文件路径和短文件名.
  403.     int nDash=strFileName.ReverseFind('//');
  404.     strPath=strFileName.Left(nDash+1);
  405.     strShortName=strFileName.Right(strFileName.GetLength()-nDash-1);
  406. }

主要程序就这些了,可以通过这样调用

   CThreadFCut FCut;

   // 文件分割.
   FCut.DoVolumeCut("","","grub.exe",4);
   FCut.DoUnitCut("","","grub.exe",30000);

   // 文件分割后合并.
   FCut.DoThreadCombine("","","grub.exe",4);
   FCut.NonThreadCombine("f://","f://","grub.exe",4);
   //SelfBind
   FCut.DoSelfBind();

  

   把路径弄好就可以使用了,所有代码都经过调试没有发现什么错误.有想学习的可以复制使用。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值