数据处理技术——排序技术

基本概念

分类

  1. 按存储介质分类
  • 内部排序:数据量不大,数据在内存,无需内外存交换数据
  • 外部排序:数据量较大,数据在外存(文件排序)
  1. 按比较器分类
  • 串行排序:单处理机(同一时刻比较一对元素)
  • 并行排序:多处理机(同一时刻比较多对元素)
  1. 按主要操作分类
  • 比较排序:用比较的方法——插入排序、交换排序、选择排序、归并排序
  • 基数排序:不比较元素的大小,仅仅根据元素本身的取值确定其有序位置
  1. 按辅助空间分类
  • 原地排序:辅助空间为O(1)的排序方法(所占的辅助空间与参加排序的数据量大小无关)
  • 非原地排序:辅助空间用量超过O(1)的方法
  1. 按稳定性分类
  • 稳定排序:能够使任何数值相等的元素,排序以后相对次序不变(对结构数据类型有意义)
  • 非稳定排序:不是稳定排序的方法
  1. 按自然性分类
  • 自然排序:输入数据越有序,排序的速度越快的排序方法
  • 非自然排序:不是自然排序的方法

学习内容

  1. 按排序依据原则
  • 插入排序:直接插入排序、折半插入排序、希尔排序
  • 交换排序:冒泡排序、快速排序
  • 选择排序:简单选择排序、堆排序
  • 归并选择:2-路归并排序
  • 基数排序
  1. 按排序所需工作量
  • 简单的排序方法:T(n) = O(n2)
  • 先进的排序方法:T(n) = O(n*log n)
  • 基数排序:T(n) = O(d * n)

存储结构——记录序列以顺序表存储

#define MAXSIZE 20
typedef int KeyType;

typedef struct {
	KeyType key;  //关键字
	InfoType otherinfo; //其它数据项
}RedType;

typedef struct {
	RedType r[MAXSIZE + 1 ];  //存储顺序表的向量,r[0]一般做哨兵或缓冲区
	int length;//顺序表长度
}SqList;

插入排序

  1. 基本操作:有序插入
  2. 算法思想:减治法思想

直接插入排序

1 核心思想:插入排序通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入,如此重复,直至完成序列排序。
2 算法分析:

  1. 从序列第一个元素开始,该元素可以认为已经被排序;
  2. 取出下一个元素,设为待插入元素,在已经排序的元素序列中从后向前扫描,如果该元素(已排序)大于待插入元素,将该元素移到下一位置;
  3. 重复步骤2,直到找到已排序的元素小于或者等于待排序元素的位置,插入元素;
  4. 重复2,3步骤,完成排序。

实例说明

在这里插入图片描述
如上图所示,以一组数据{12,15,9,20,6,31,24} 为例,进行直接插入排序的算法演示:
默认序列第一个元素12 以及被排序。
取下一元素 15 从后往前与已排序序列一次比较,15插入12 之后,已排序序列为[12,15]。
取下一元素9,重复2步骤,将9插12 之前,已排序序列为[9,12,15]。
循环上述操作,直至最后一个元素24,插入合适位置,完成排序。

代码实现

 for(int i=1;i<N;i++) 
    {
        int temp=vi[i];
        int j;
        for(j=i-1;j>=0&&temp<vi[j];j--)
        {
            vi[j+1]=vi[j]//将较大元素后移
        }
        vi[j+1]=temp;        //temp插入正确的位置
    }

————————————————
版权声明:以上本节为CSDN博主「kolin胡」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/hlc246/article/details/81076183

动画演示

在这里插入图片描述

折半插入排序

  1. 查找插入位置时采用折半查找法
  2. 与直接插入排序相比较:
  • 减少了比较次数,但没有减少移动次数
  • 平均性能优于直接插入排序

希尔排序

本质

分组插入排序,该方法又称缩小增量排序
是对直接插入排序的一种优化
(三个for+while)

基本思想

希尔排序是将待排序的数组元素 按下标的一定增量分组 ,分成多个子序列,然后对各个子序列进行直接插入排序算法排序;然后依次缩减增量再进行排序,直到增量为1时,进行最后一次直接插入排序,排序结束。
增量d 的范围: 1<= d < 待排序数组的长度 (d 需为 int 值)
增量的取值: 般的初次取序列(数组)的一半为增量,以后每次减半,直到增量为1。
第一个增量=数组的长度/2,
第二个增量= 第一个增量/2,
第三个增量=第二个增量/2,
以此类推,最后一个增量=1。
好的增量序列的共同特征:
① 最后一个增量必须为1;
② 应该尽量避免序列中的值(尤其是相邻的值)互为倍数的情况。

作者:Promise_Sun
链接:https://www.jianshu.com/p/d730ae586cf3
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

优点

希尔排序是基于直接插入排序的以下两点性质而提出的改进方法:

  1. 插入排序在对几乎已经排好序的数据操作时,效率高,即可以达到线性排序的效率。
  2. 插入排序一般来说是低效的,因为插入排序每次只能将数据移动一位。

图解

在这里插入图片描述
该节以上
作者:Promise_Sun
链接:https://www.jianshu.com/p/d730ae586cf3
来源:简书

代码实现

#include <stdio.h>
#include <malloc.h>

void shellSort(int *a, int len); // 函数声明

int main(void)
{
    int i, len, * a;
    printf("请输入要排的数的个数:");
    scanf("%d",&len);
    a = (int *)malloc(len * sizeof(int)); // 动态定义数组
    printf("请输入要排的数:\n");
    for (i = 0; i < len; i++) { // 数组值的输入
        scanf("%d",&a[i]);
    }   
    shellSort(a, len); // 调用希尔排序函数
    printf("希尔升序排列后结果为:\n");
    for (i = 0; i < len; i++) { // 排序后的结果的输出
        printf("%d\t",a[i]);
    }
    printf("\n");

    return 0;
}

void shellSort(int *a, int len)
{
    int i, j, k, tmp, gap;  // gap 为步长
    for (gap = len / 2; gap > 0; gap /= 2) {  // 步长初始化为数组长度的一半,每次遍历后步长减半,
    	for (i = 0; i < gap; ++i) { // 变量 i 为每次分组的第一个元素下标 
	        for (j = i + gap; j < len; j += gap) { //对步长为gap的元素进行直插排序,当gap为1时,就是直插排序
	            tmp = a[j];  // 备份a[j]的值
	            k = j - gap;  // j初始化为i的前一个元素(与i相差gap长度)
	            while (k >= 0 && a[k] > tmp) {
	                a[k + gap] = a[k]; // 将在a[i]前且比tmp的值大的元素向后移动一位
	                k -= gap;
	            }
	            a[k + gap] = tmp; 
	        }
	    }
    }
}

交换排序

基本思想:两两比较,如果发生逆序则交换,直到所有记录都排好序为止

冒泡排序

基本思想:每趟不断将记录两两比较,并按“前小后大”规则交换

快速排序

  1. 基本思想:
  • 任取一个元素(如:第一个)为中心
  • 所有比它小的元素一律前放,比它大的元素一律后放,形成左右两个子表;
  • 对各子表重新选择中心元素并依此规则调整
  • 直到每个子表的元素各剩一个
  1. 平均时间复杂度O(n*log n)
  2. 输入元素的次序越乱,排序速度越好

选择排序

简单选择排序

基本思想:在待排序的数据中选出最大的元素放在其最终的位置

堆排序

完全二叉树、父母优势

  1. 堆的调整
  2. 堆的构造

归并排序

基本思想:将两个或两个以上的有序子序列“归并”为一个有序序列
在内部排序中,通常采用2-路归并排序

基数排序

基本思想:分配+收集,也叫桶排序或箱排序,对关键字范围确定的可用
基数排序的数字是有范围的,均由0-9这十个数字组成,则只需设置十个箱子,相继按个、十、百…进行排序
算法复杂度分析:

  • 时间效率O(k*(m+n)),k:关键字个数 m:关键字取值范围为m个值
  • 空间效率O(n+m)

外部排序

总结

在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值