归并排序算法
归并排序算法是一种外部存储设备最常用的排序算法,该排序法可以分为如下两个步骤:
(1)将排序数据分为数个文件,其中每个文件的大小都是可以加载到内存空间,然后使用适当的内部排序算法进行排序,最后将排完序的数据写回文件中;
(2)将第一个步骤创建的文件,两两归并称为了一个文件,最后,全部的文件都归并称为一个文件,则文件数据也就排序完成了。
如下图所示的例子:
一个大文件,分为4个小文件1,2,3,4。对1,2,3,4文件中的数据读入内存进行排序,此时,1,2,3,4文件中的数据是有序的。
然后利用归并排序算法,把1,2归并到文件5中,把3,4文件归并到文件6中。
最后,再利用归并算法把文件5和文件6归并到文件7中,则文件7就是排好序的文件。
归并排序算法的实现代码如下所示:
/************************************/
/*归并排序算法实现------------------*/
/************************************/
#include <stdio.h>
#include <stdlib.h>
#define LEN 4
void merge_sort(FILE *result, FILE *sort1, FILE *sort2, int len)
{
int s1, s2; //数据统计
char c, c1, c2;
c1 = getc(sort1);
c2 = getc(sort2);
s1 = s2 = 0;
while(1)
{
if(c1 < c2)
{
putc(c1, result);
s1++;
if(s1 < len)
{
c1 = getc(sort1);
}
else
{
break;
}
}
else
{
putc(c2, result);
s2++;
if(s2 < len)
{
c2 = getc(sort2);
}
else
{
break;
}
}
}
if(s1 < len)
{
putc(c1, result);
s1++;
}
if(s2 < len)
{
putc(c2, result);
s2++;
}
while(s1 < len)
{
c = getc(sort1);
putc(c, result);
s1++;
}
while(s2 < len)
{
c = getc(sort2);
putc(c, result);
s2++;
}
}
int main()
{
FILE *fp;
FILE *fp1;
FILE *fp2;
fp = fopen("result.txt", "w+");
if(NULL == fp)
{
printf("Open the file error!\n");
}
else
{
fp1 = fopen("sort1.txt", "r+");
if(NULL == fp1)
{
printf("Open the first file error!\n");
}
else
{
fp2 = fopen("sort2.txt", "r+");
if(NULL == fp2)
{
printf("Open the second file error!\n");
}
else
{
printf("During the Data Processing, Please wait...\n");
merge_sort(fp, fp1, fp2, LEN);
printf("Finished the Data processing!\n");
fclose(fp);
fclose(fp1);
fclose(fp2);
}
}
}
return 0;
}
其中sort1.txt和sort2.txt文件中必须存储的是以排序的数据,例如,sort1.txt中的内容为1358。sort2.txt文件中的内容为4697。
这个程序的时间复杂度和两个文件中数据的个数成正比,所以排序的效率是O(n)。此处没有考虑从文件中读取和写入的时间。