【数据结构取经之路】单链表_建立单链表为什么取地址-CSDN博客

本文链接：https://blog.csdn.net/bit_pan/article/details/135300542

何为单链表及单链表的意义

单链表是一种链式存取的数据结构，用一组地址任意的存储单元存放线性表中的数据元素。链表中的数据是以结点来表示的，每个结点的构成：数据域 + 指针域，数据域就是存储数据的存储单元，指针域就是连接每个结点的地址数据。

接着再来说说单链表的意义，也就是它的优势。单链表的优势是相对于和它同属于线性表的顺序表而言的。顺序表的特点是逻辑关系上相邻的两个元素在物理位置上(内存中的真实存储情况)也相邻，因此，可以通过下标的随机访问来取出任意元素。但也正因为顺序表物理空间上的连续，在作插入或删除操作时，需要移动大量元素。可以试想，在含有100个元素的顺序表中，要删除第一个元素，后面的99个元素都得往前挪，这将导致了效率降低。单链表的出现，弥补了这一缺点，因为单链表不要求逻辑上相邻的元素物理位置上也相邻，在删除指定元素时，直接free掉就好，但单链表也失去了顺序表可随机存取的优点。明白了单链表节点中包含的内容后，将其转成代码，如下：

typedef int STDataType;//类型重命名

typedef struct STNode
{
	STDataType data;     //数据域
	struct STNode* next; //指针域
}STNode;

单链表的头插

单链表的头插，这里将提供两种方法。第一种方法是：不带哨兵位的头；第二种是：带哨兵位的头。哨兵位的头就是一块不存放有效数据的空间，它的指针指向真正的头结点。这里很抽象，结合下面讲解的第二种方法更有助于理解。相较于带哨兵位的头结点，不带哨兵位的头结点更难理解，不过，在理解了不带哨兵位的头结点后，在学习带哨兵位的头结点时就是降维打击了。

不带哨兵位的头

直接用head指针指向头结点，并没有malloc一块空间出来当哨兵，这中做法就是不带哨兵位的头结点。下面就来进入真正的主题——单链表的头插。首先，最重要的一点就是抓住问题的本质，在插入数据时，要想方设法把链表给链接起来，这是关键。

> 第一步，malloc一个结点并存入数据

考虑到单链表的尾插模块也需要malloc出结点，因此，封装一个专门产生结点的函数是有必要的，这里将该函数命名为STBuyNode。该函数的内部细节如下：

STNode* STBuyNode(STDataType x)
{
	STNode* newnode = (STNode*)malloc(sizeof(STNode));
	if (newnode == NULL)
	{
		perror("malloc fail\n");
		return NULL;
	}

	newnode->data = x;    //插入数据
	newnode->next = NULL;

	return newnode;
}

> 第二步，也就是最关键的一步，链接。

链表为空时的头插很简单，让head指向newnode即可。如果不为空，结合下图，假设在B前插入A 。

第一步，newnode->next 指向 head; 第二步，把head移动到newnode的位置，指向新的头。

代码如下：

//给出这段代码是为了能够看清传给STPushFront的参数
/*void TestList()
{
	STNode* plist = NULL;//初始化为空,plist为头指针

	STPushFront(&plist, 1);
	STPushFront(&plist, 2);
	STPushFront(&plist, 3);
	STPushFront(&plist, 4);
}

int main()
{
	TestList();

	return 0;
}*\

//STPushFront内部
void STPushFront(STNode** pphead, STDataType x)
{
	assert(pphead);

	STNode* newnode = STBuyNode(x);
	if (newnode == NULL)
		return;

	//链表为空
	if (*pphead == NULL)//初始化为空
	{
		*pphead = newnode;
	}
	//不为空
	else
	{
		newnode->next = *pphead;
		*pphead = newnode;
	}
}

可以看到，这里用到了二级指针。之所以用二级指针是因为除了链表为空时的插入，其余的头插都需要改变头指针plist, 使plist指向新的头，plist 的类型为 STNode*，所以要用二级指针STNode**才能改变plist(即*pphead)。下面还会继续解释这一点。

看了上面头插的代码，你可能会有很多疑问。下面将列出常见的几个疑问并逐个解答。

为什么写成STNode* plist,而不是STNode plist?也就是说，为什么创建结构体指针而不是结构体？

这一问题其实在上文已经提到了答案，STNode* plist 中，plist是结构体指针，只要将其指向单链表的头结点就可以唯一确定一个单链表，通过plist指针，可以访问到单链表的任意一个结点。而STNode plist中的plist,存不了头结点的地址，因此无法通过它找到单链表，写成STNode* plist也就顺理成章了。

为什么使用二级指针而不是一级指针？

要回答清楚这一问题，需要一步步引入，篇幅比较长，还请读者耐心阅读。

首先，以交换int类型的a、b的值为引子。在调用交换函数Swap时，我们会这样写：Swap（&a, &b) ，传的是a和b的地址，a、b的地址类型为int*。如果这样写：Swap（a, b）,显然是无法达到交换的目的的。因为形参是实参的一份临时拷贝，传值时，对形参的修改不会影响实参。拿不到a和b的地址就无法改变a、b的值。举这一例子是为了说明并达成第一个共识：在主函数内调用其他函数时，要想在被调用函数内改变主函数中变量的值，就要传变量的地址。int类型的变量，需要int*才能改变。char类型的变量，需要char*才能改变。要想改变STNode* plist中的plist,就要用STNode**类型的指针才能实现。我们需要达成的第二个共识是：在每一次头插时，都需要改变plist指针，使其指向新的头结点。所以，在函数STPushFront的参数中使用二级指针也就理所当然了。再来看看，如果使用的是一级指针，也就是说头插函数写成这样子：void STPushFront(STNode* phead, STDataType x)。下面来分析为什么写成这样不行。这里用到了函数栈帧的创建与销毁的知识。如果此处用一级指针，则代码如下：

//给出这段代码是为了能够看清传给STPushFront的参数
/*void TestList()
{
	STNode* plist = NULL;//初始化为空,plist为头指针

	STPushFront(&plist, 1);
	STPushFront(&plist, 2);
	STPushFront(&plist, 3);
	STPushFront(&plist, 4);
}

int main()
{
	TestList();

	return 0;
}*\

//STPushFront内部
void STPushFront(STNode* phead, STDataType x)
{
	STNode* newnode = STBuyNode(x);
	if (newnode == NULL)
		return;

	//链表为空
	if (phead == NULL)//初始化为空
	{
		phead = newnode;
	}
	//不为空
	else
	{
		newnode->next = phead;
		phead = newnode;
	}
}

将一级指针plist传给phead,本质上就是把plist中的内容拷贝一份给phead,假设plist中存储了头结点的地址0x12FFA0,那么phead中也将会存储头结点的地址0x12FFA0,这时候，这两个指针同时指向单链表的头。接着头插新的结点newnode，然后链接并将phead里的值改为新的头结点newnode的地址0x12FFB0,这时，phead将指向newnode,但是并不会使plist也指向newnode，所以此函数用了二级指针。如果非要用一级指针不可，那也不是没有办法。其中一个办法是返回phead,然后将返回值手动赋值给plist,确保plist始终指向链表的头，请看代码：

//给出这段代码是为了能够看清传给STPushFront的参数
/*void TestList()
{
	STNode* plist = NULL;//初始化为空,plist为头指针

	STNode* ret = STPushFront(plist, 1);
    plist = ret;                            //手动赋值

	ret = STPushFront(plist, 2);
    plist = ret;

	ret = STPushFront(plist, 3);
    plist = ret;
 
	ret = STPushFront(plist, 4);
    plist = ret; 
}

int main()
{
	TestList();

	return 0;
}*\

//STPushFront内部
STNode* STPushFront(STNode* phead, STDataType x)  //修改了返回类型
{
	STNode* newnode = STBuyNode(x);
	if (newnode == NULL)
		return;

	//链表为空
	if (phead == NULL)//初始化为空
	{
		phead = newnode;
	}
	//不为空
	else
	{
		newnode->next = phead;
		phead = newnode;
	}
    
    return phead;         //返回phead
}

不用二级指针的第二种方法就是下面要讲的带哨兵位的头。

带哨兵位的头

这就是带哨兵位的头的单链表。哨兵位的头结点中不存放有效数据，它指向的下一个结点才是真正的头结点。哨兵位的头结点的存在，可以在头插时很好理解。同时呢，在每一次头插时，需要改变的是哨兵位头结点里的成员next，也就是要改变结构体，用结构体指针，也就是一级指针即可。头插的过程如下：

代码如下：

//给出这段代码是为了能够看清传给STPushFront的参数
/*void TestList()
{
	STNode* plist = STBuyNode(-1);  //plist为哨兵位的头

	STPushFront(plist, 1);
	STPushFront(plist, 2);
	STPushFront(plist, 3);
	STPushFront(plist, 4);
}

int main()
{
	TestList();

	return 0;
}*\

//STPushFront内部
void STPushFront(STNode* phead, STDataType x)
{
	STNode* newnode = STBuyNode(x);
	if (newnode == NULL)
		return;

	newnode->next = phead->next;
    phead->next = newnode;
}

通过对比这两种写法，显然带哨兵位的头写起来更简洁也更容易让人理解，但在一些刷题网站，比如力扣上，默认是不带哨兵位的头结点的，还有一点，就是理解了不带哨兵位的头结点后，带哨兵位的头结点的方法将会很好理解。

声明：以下功能的实现都是基于不带哨兵位的头结点的单链表

单链表的尾插

单链表的尾插很关键的一点是找到单链表的尾结点，然后在插入。可以结合上面单链表的图示想想，单链表的尾结点的特点是什么呢？通过观察可以发现：单链表的尾结点的next为NULL。找到这一特点以后，问题就很好解决了。下面请看代码：

//给出这段代码是为了看清传的参数
/*void Testlist()
{
	STNode* plist = NULL;

	STPushBack(&plist, 1);
	STPushBack(&plist, 2);
	STPushBack(&plist, 3);
	STPushBack(&plist, 4);

	STPrint(plist);

}*\

void STPushBack(STNode** pphead, STDataType x)
{
	assert(pphead);

	STNode* newnode = STBuyNode(x);
	if (newnode == NULL)
		return;

	if (*pphead == NULL)
	{
		*pphead = newnode;
	}
	else
	{
		STNode* tail = *pphead;
		while (tail->next)
		{
			tail = tail->next;
		}

		tail->next = newnode; 
	}
}

在插入的时候，要分两种情况：第一，单链表为空；第二，单链表不为空。当单链表为空时，直接将头指针指向newnode即可。当单链表不为空时，才需要找尾。

单链表的头删

可以想像到，每次头删时都要改变头指针的指向，所以用二级指针是无疑的。头删的步骤如下：

> 保存当前头结点

> 将当前头结点更新为它的下一个结点next，更新完头结点后，free掉原来的头结点

请看代码：

//给出这一段代码是为了看清函数的参数
/*void Testlist()
{
	STNode* plist = NULL;

	STPushBack(&plist, 1);
	STPushBack(&plist, 2);
	STPushBack(&plist, 3);
	STPushBack(&plist, 4);

	STPrint(plist);

	STPopFront(&plist);
	STPopFront(&plist);
	STPopFront(&plist);
	STPopFront(&plist);

	STPrint(plist);
}*\

void STPopFront(STNode** pphead)
{
	assert(pphead);
	assert(!STEmpty(pphead));

	STNode* del = *pphead;
	*pphead = del->next;
	free(del);
}

单链表的尾删

要删除尾结点，找到尾结点是必需的。尾结点的特点是next结点为空，根据这一特点，我们很容易找到尾结点。请看代码吧！

//给出这一段代码是为了看清函数的参数
/*void Testlist()
{
	STNode* plist = NULL;


	STPushBack(&plist, 3);
	STPushBack(&plist, 4);

	STPrint(plist);

    STPopBack(&plist);

	STPrint(plist);
}*\
void STPopBack(STNode** pphead)
{
	assert(pphead);
	assert(!STEmpty(pphead));

	STNode* tail = *pphead;

	while (tail->next)
	{
		tail = tail->next;
	}

	free(tail);
}

如果这么写，一跑起来就会出问题！为什么呢？请看图：

尾结点即为上图的C结点，注意看，当free掉C结点后，B结点中的 next 还指向C结点，但是这块空间已经不属于该程序了，也就是说B结点中的next指针为野指针，此时已经导致了非法访问，编译器自然会报错。解决办法就是：将尾指针的上一个结点中的next置空。因为这是单链表，所以无法直接通过尾结点找到它的上一个节点。我们可以这样：当tail->next->next == NULL,tail此时就是尾结点的上一个结点，删掉尾结点后，tail就是新的尾结点。但是这么做的话，必须要保证至少有两个结点。所以，分为两种情况，第一，只有一个结点；第二，有多个节点。如果没有结点，也就是说链表为空，那么过不了断言，不用担心。

正确的尾删代码：

//给出这一段代码是为了看清函数的参数
/*void Testlist()
{
	STNode* plist = NULL;


	STPushBack(&plist, 3);
	STPushBack(&plist, 4);

	STPrint(plist);

    STPopBack(&plist);

	STPrint(plist);
}*\

void STPopBack(STNode** pphead)
{
	assert(pphead);
	assert(!STEmpty(pphead));

	STNode* tail = *pphead;

	if (tail->next == NULL)
	{
		free(tail);
		tail = NULL;
	}
	else
	{
		while (tail->next->next)
		{
			tail = tail->next;
		}

		free(tail->next);
		tail->next = NULL;
	}
}

单链表的查找

单链表的查找就是要遍历单链表，查找常常伴随着修改，请看代码：

//给出这一段代码是为了看清函数的参数
/*void Testlist()
{
	STNode* plist = NULL;


	STPushBack(&plist, 3);
	STPushBack(&plist, 4);

	STPrint(plist);

    STNode* pos = STFind(&plist, 3);
	if (pos != NULL)
	{
		pos->data = 999;
		STPrint(plist);
	}
}*\

STNode* STFind(STNode** pphead, STDataType x)
{
	assert(pphead);
	
	if (*pphead == NULL)
		return NULL;
	else
	{
		STNode* cur = *pphead;
		while (cur)
		{
			if (cur->data == x)
				return cur;

			cur = cur->next;
		}

		return NULL;
	}
}

单链表在pos结点之前插入

要实现在pos位置前插入新的结点，就需要找到pos前的结点prev,从而可以使prev结点和新结点链接起来。但是。这时单链表，不能往回找，所以只能遍历链表找到prev结点，prev结点的特点是prev->next == pos.请看代码：

//给出这段代码是为了看清函数的参数
/*void Testlist()
{
	STNode* plist = NULL;

	STPushFront(&plist, 1);
	STPushFront(&plist, 2);
	STPrint(plist);

	STNode* pos = STFind(&plist, 1);
	if (pos != NULL) STInsertBefor(&plist, pos, 999);
	STPrint(plist);
}*\

void STInsertBefor(STNode** pphead, STNode* pos, STDataType x)
{
	assert(pphead);
	assert(pos);

	STNode* newnode = STBuyNode(x);
	STNode* prev = *pphead;

	while (prev->next != pos)
	{
		prev = prev->next;
	}

	newnode->next = pos;
	prev->next = newnode;
}

请仔细想想，当pos == *pphead时，这段代码会不会出问题？

答案是肯定的。请看下面的分析：

正确的代码如下：

void STInsertBefor(STNode** pphead, STNode* pos, STDataType x)
{
	assert(pphead);
	assert(pos);

	STNode* newnode = STBuyNode(x);

	if (pos == *pphead)
	{
		STPushFront(pphead, x);//调用头插函数
	}
	else
	{
		STNode* prev = *pphead;

		while (prev->next != pos)
		{
			prev = prev->next;
		}

		newnode->next = pos;
		prev->next = newnode;
	}
}

单链表删除pos结点

例如，要删掉结点B。首先得找到B的前一个结点A，然后将结点A和结点C链接起来，最后释放掉B结点。还有一种情形：要删除的是头结点，遇到这种情况，可以调用头删函数，也可以参考下面的写法：

/*void Testlist()
{
	STNode* plist = NULL;

	STPushFront(&plist, 4);
	STPrint(plist);

	STNode* pos = STFind(&plist, 4);
	if (pos != NULL) STErase(&plist, pos);
	STPrint(plist);

}*\

void STErase(STNode** pphead, STNode* pos)
{
	assert(pphead);
	assert(!STEmpty(pphead));

	STNode* prev = *pphead;

	if (*pphead == pos)
	{
		*pphead = prev->next;
	}
	else
	{
		while (prev->next != pos) prev = prev->next;
		prev->next = pos->next;
	}

	free(pos);
}

单链表的销毁

单链表的销毁直接释放掉malloc出来的结点就结束了。请看代码：

//给出这段代码是为了看清函数的参数
/*void Testlist()
{
	STNode* plist = NULL;

	STPushFront(&plist, 1);
	
	STPrint(plist);

	STDestroy(&plist);
}*\

void STDestroy(STNode** pphead)
{
	assert(pphead);
	assert(!STEmpty(pphead));

	STNode* cur = *pphead;
	while (cur)
	{
		STNode* next = cur->next;
		free(cur);
		cur = next;
	}

	*pphead = NULL;
}

完！