DSA之十大排序算法第八种:Counting Sort

计数排序 2019年9月1日13:48:16
相较于之前的比较式的排序算法,计数排序就大大的不同了。计数排序不是比较排序,排序的速度当然也就快于任何比较排序算法。其基本思想:将待排序的数据值 转化为键存储在额外开辟的数组空间中。对每一个输入的元素data,确定出小于data的元素的个数。于是那么就可以把data 直接放到相应的位置上。
它作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数。(我这里统一处理为:myvec.push_back(rand() % 11);//这组数据的范围是:0---10)因此当输入的元素是 n 个 0 到 k 之间的整数时,它的运行时间是 Θ(n + k)。

因为用来计数的数组temp_src的长度取决于待排序数组中数据的范围(等于待排序数组的最大值与最小值的差加上1),这使得计数排序对于数据范围很大的数组,需要大量时间和内存。例如:计数排序是用来排序0到100之间的数字的最好的算法,但是它不适合按字母顺序排序人名。但是,计数排序可以用在基数排序中的算法来排序数据范围很大的数组。

通俗地理解,例如有 10 个年龄不同的人,统计出有 8 个人的年龄比 A 小,那 A 的年龄就排在第 9 位,用这个方法可以得到其他每个人的位置,也就排好了序。当然,年龄有重复时需要特殊处理(保证稳定性),这就是为什么最后要反向填充目标数组,以及将每个数字的统计次数减去 1 的原因。
排序步骤就是:

  1. 找出待排序的数组中最大的元素maxval,将临时存放 次数的数组temp_src 开辟出来。
  2. 统计数组中每个值为i的元素出现的次数,存入数组temp_src的第i项。所以这也是为什么要 开辟maxval+1 的空间。把maxval也作为一个下标。
  3. 对所有的计数累加(从temp_src中的第1 号元素开始,每一项和前一项相加)
  4. 反向填充目标数组:将src数组的每个元素src[i] 放在新数组new_src的第temp_src【i 】项,每放一个元素就将temp_src【src[i]】减去1。表示放置了一个元素,统计次数可以减一。
    在这里插入图片描述
分析具体实现:

如上图所示(从菜鸟网站“拿”来的):面对下面的一组数据:

2,5,3,0,2,3,0,3

首先统计出来:size=8,maxval=5。所以说:开辟一个 6个空间大小的数组即可,即temp_src(maxval + 1)。接下来:把src【i】的数据作为 这个temp_src的下标,进行统计 每个数据出现的次数,并把这个次数作为新记录数组的下标。

再接下来就是统计出来:待排序列中小于等于每一个元素data的个数,并把结果记录到辅助数组temp_src[0~maxval]中,从而确定data在排好序的新数组中的位置。如下:

	for (int i = 1; i < temp_src.size(); ++i)
	{
		temp_src[i] += temp_src[i - 1];//小于当前数据元素的个数
	}

最后就可以进行反向处理数组,放置元素。我把步骤打开,这样便于理解。

	int new_index_of_newsrc = 0;//新空间  元素的下标
	for (int i = size - 1; i >= 0; --i)
	{
		new_index_of_newsrc = --temp_src[src[i]];
		new_src[new_index_of_newsrc] = src[i];
	}

反向处理,把src中的数据一个个的取出来 进行操作。temp_src数组里面 存放的是:这个元素 i 应该在新的数组new_src中的 第几个位置,所以这里需要 先进行–temp_src[src[i]]操作,以得到正确的下标。接下来就可以把这个数据元素src[i] 值放入新数组中的了。很巧妙的是:在其中,重复数据的下标 也得到了处理。

分析排序算法:

计数排序是一种线性排序算法,不用比较元素的大小。待排序序列中元素都是整数,且在0~maxval之间,maxval为整数。稳定性强,时间复杂度为O(n+maxval),n为输入元素个数,maxval为待排序列中最大的数。但局限性大,只限于对整数进行排序。
这种通过牺牲空间复杂度来获取 高效的时间的排序方式,空间复杂度为O(n)。

排序算法实现 (标准版本):
void Counting_sort(vector<int>& src)
{
	int size = src.size();
	static int count = 0;//记录循环进入的次数
	int maxval = src[0];//记录数组中元素的最大值

	for (int i = 1; i < size; ++i)
	{
		if (src[i] > maxval)
			maxval = src[i];
	}

	//所以说 应该开辟的大小就是maxval+1
	vector<int>temp_src(maxval + 1);//这是临时开辟的数组,全初始化为0

	//统计值为src[i]的个数;而temp_src[i]是等于i的元素个数
	for (int i = 0; i < size; ++i)
	{
		//统计 每个数据出现的次数,并把这个次数作为新记录数组的下标
		temp_src[src[i]]++;
	}
	for (int i = 1; i < temp_src.size(); ++i)
	{
		temp_src[i] += temp_src[i - 1];//小于当前数据元素的个数
	}
	//接下来就是反向处理数组,放置元素
	//需要再额外开辟一块和 src一样大小的数组空间
	vector<int>new_src;
	new_src.resize(size);
	int new_index_of_newsrc = 0;//新空间元素的下标
	for (int i = size - 1; i >= 0; --i)
	{
		new_index_of_newsrc = --temp_src[src[i]];
		new_src[new_index_of_newsrc] = src[i];
		count++;
	}

	src.clear();
	for (int i = 0; i < size; ++i)
	{
		src.push_back(new_src[i]);
	}
	
	cout << "共进入循环次数:" << count << endl;
}
排序算法实现 (自创版本):

注:我在看了最上面的动态演示之后,提笔写出来的代码。我也没有事先阅读 源代码,但是等我阅读源代码,之后 总是感觉怪怪的:有一种 “脱裤子放屁”的感觉。大家看到这个地方 先不要笑,先替我看一下我的代码。如下:

void Counting_sort1(vector<int>& src)
{
	int size = src.size();
	static int count = 0;//记录循环进入的次数
	int maxval = src[0];//记录数组中元素的最大值

	for (int i = 1; i < size; ++i)
	{
		if (src[i] > maxval)
			maxval = src[i];
	}

	//所以说 应该开辟的大小就是maxval+1
	vector<int>temp_src(maxval  + 1);//这是临时开辟的数组,全初始化为0

	for (int i = 0; i < size; ++i)
	{
		//统计 每个数据出现的次数,并把这个次数作为新记录数组的下标
		temp_src[src[i]]++;
	}

	//接下来就是反向处理数组,放置元素
	src.clear();
	for (int i = 0; i < temp_src.size(); ++i)
	{
		while (temp_src[i] != 0)
		{
			src.push_back(i);
			temp_src[i]--;
			count++;
		}
	}
	cout << "共进入循环次数:" << count << endl;
}

2019年9月1日14:38:24
我不想再看了,头疼 若有老哥发现问题,定要致谢,还请各位不吝赐教。

全部源代码及测试如下:

/**══════════════════════════════════╗
*作    者:songjinzhou                                                 ║
*CSND地址:https://blog.csdn.net/weixin_43949535                       ║
***GitHub:https://github.com/TsinghuaLucky912/My_own_C-_study_and_blog║
*═══════════════════════════════════╣
*创建时间:2019年9月1日11:34:01                                                            
*功能描述:                                                            
*                                                                      
*                                                                      
*═══════════════════════════════════╣
*结束时间: 2019年9月1日13:50:07                                                            
*═══════════════════════════════════╝
//                .-~~~~~~~~~-._       _.-~~~~~~~~~-.
//            __.'              ~.   .~              `.__
//          .'//              西南\./联大               \\`.
//        .'//                     |                     \\`.
//      .'// .-~"""""""~~~~-._     |     _,-~~~~"""""""~-. \\`.
//    .'//.-"                 `-.  |  .-'                 "-.\\`.
//  .'//______.============-..   \ | /   ..-============.______\\`.
//.'______________________________\|/______________________________`.
*/
#include <iostream>
#include <vector>
#include <iomanip>
#include <time.h>

using namespace std;

const int MAX = 15;

void Counting_sort1(vector<int>& src)
{
	int size = src.size();
	static int count = 0;//记录循环进入的次数
	int maxval = src[0];//记录数组中元素的最大值

	for (int i = 1; i < size; ++i)
	{
		if (src[i] > maxval)
			maxval = src[i];
	}

	//所以说 应该开辟的大小就是maxval+1
	vector<int>temp_src(maxval  + 1);//这是临时开辟的数组,全初始化为0

	for (int i = 0; i < size; ++i)
	{
		//统计 每个数据出现的次数,并把这个次数作为新记录数组的下标
		temp_src[src[i]]++;
	}

	//接下来就是反向处理数组,放置元素
	src.clear();

	for (int i = 0; i < temp_src.size(); ++i)
	{
		while (temp_src[i] != 0)
		{
			src.push_back(i);
			temp_src[i]--;
			count++;
		}
	}
	cout << "共进入循环次数:" << count << endl;
}

void Counting_sort(vector<int>& src)
{
	int size = src.size();
	static int count = 0;//记录循环进入的次数
	int maxval = src[0];//记录数组中元素的最大值

	for (int i = 1; i < size; ++i)
	{
		if (src[i] > maxval)
			maxval = src[i];
	}

	//所以说 应该开辟的大小就是maxval+1
	vector<int>temp_src(maxval + 1);//这是临时开辟的数组,全初始化为0

	//统计值为src[i]的个数;而temp_src[i]是等于i的元素个数
	for (int i = 0; i < size; ++i)
	{
		//统计 每个数据出现的次数,并把这个次数作为新记录数组的下标
		temp_src[src[i]]++;
	}
	for (int i = 1; i < temp_src.size(); ++i)
	{
		temp_src[i] += temp_src[i - 1];//小于当前数据元素的个数
	}
	//接下来就是反向处理数组,放置元素
	//需要再额外开辟一块和 src一样大小的数组空间
	vector<int>new_src;
	new_src.resize(size);
	int new_index_of_newsrc = 0;//新空间元素的下标
	for (int i = size - 1; i >= 0; --i)
	{
		new_index_of_newsrc = --temp_src[src[i]];
		new_src[new_index_of_newsrc] = src[i];
		count++;
	}

	src.clear();
	for (int i = 0; i < size; ++i)
	{
		src.push_back(new_src[i]);
	}
	
	cout << "共进入循环次数:" << count << endl;
}

int main()
{
	srand((unsigned)time(nullptr));

	vector<int>myvec;
	for (int i = 0; i < MAX; ++i)
	{
		myvec.push_back(rand() % 11);//这组数据的范围是:0---10
	}
	cout << "数列初始状态:";
	for (int val : myvec)
		cout << setw(2) << val << " ";
	cout << endl;
	cout << "/*------------------------------------*/" << endl;
	Counting_sort1(myvec);
	cout << "/*------------------------------------*/" << endl;
	cout << "数列最终状态:";
	for (int val : myvec)
		cout << setw(2) << val << " ";
	cout << endl;
	cout << "*********************************************" << endl;

	int Array[] = { 2,5,3,0,2,3,0,3 };
	vector<int>myvec1(begin(Array), end(Array));
#if 0
	for (int i = 0; i < MAX; ++i)
	{
		myvec1.push_back(rand() % 11);//这组数据的范围是:0---10
	}
#endif 

	cout << "数列初始状态:";
	for (int val : myvec1)
		cout << setw(2) << val << " ";
	cout << endl;
	cout << "/*---------------------------------------*/" << endl;
	Counting_sort(myvec1);
	cout << "/*---------------------------------------*/" << endl;
	cout << "数列最终状态:";
	for (int val : myvec1)
		cout << setw(2) << val << " ";
	cout << endl;
	
	return 0;
}
/**
*备用注释:
*
*
*
*/

Counting_sort 是教程上 和 CSDN各位大佬的版本
Counting_sort1 是我自己 随手写的
在这里插入图片描述

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

孤傲小二~阿沐

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值