今天在学习《程序员使用算法》时,看到了单链表快排序这一节。初看时感觉程序有很大的问题,但是细细品味之后却发现程序设计的极为巧妙,同时又深感自己C语言指针知识之不牢固,特别是指针的指针方面的知识。
单链表的快排序和数组的快排序基本思想相同,同样是基于划分,但是又有很大的不同:单链表不支持基于下标的访问。故书中把待排序的链表拆分为2个子链表。为了简单起见,选择链表的第一个节点作为基准,然后进行比较,比基准大节点的放入左面的子链表,比基准大的放入右边的子链表。在对待排序链表扫描一遍之后,左面子链表的节点值都小于基准的值,右边子链表的值都大于基准的值,然后把基准插入到链表中,并作为连接两个子链表的桥梁。然后根据左右子链表中节点数,选择较小的进行递归快速排序,而对数目较多的则进行跌等待排序,以提高性能。
排序函数中使用的变量如下:
struct node *right; //右边子链表的第一个节点
struct node **left_walk, **right_walk; //作为指针,把其指向的节点加入到相应的子链表中
struct node *pivot, *old; //pivot为基准, old为循环整个待排序链表的指针
核心代码如下:
for (old = (*head)->next; old != end; old = old->next) {
if (old->data < pivot->data) { //小于基准,加入到左面的子链表,继续比较
++left_count;
*left_walk = old; //把该节点加入到左边的链表中,
left_walk = &(old->next);
} else { //大于基准,加入到右边的子链表,继续比较
++right_count;
*right_walk = old;
right_walk = &(old->next);
}
}
head为struct node **类型,指向链表头部,end指向链表尾部,可为NULL,这段程序的重点在于指针的指针的用法,*left_walk为一个指向node节点的指针,说的明白点*left_walk的值就是node节点的内存地址,其实还有一个地方也有node的地址,那就是指向node的节点的next域,故我们可以简单的认为*left_walk = old就是把指向node节点的节点的next域改为节点old的地址,这样可能造成两种情况:一种就是*left_walk本来就指向old节点,这样就没有改变任何改变,另一种则是改变了*right_walk指向节点的前一个节点的next域,使其指向后部的节点,中间跳过了若干个节点,不过在这里这样做并不会造成任何问题,因为链表中的节点要么加入到左面的子链表中,要么加入到右面的子链表中,不会出现节点丢失的情况。
下面用图示说明下上面的问题:
这里假设链表的值一次是5、2、4、6