计数排序(Counting sort)

组别：入门级
难度：3

算法描述：
找出待排序的数组中最大和最小的元素；
统计数组中每个值为i的元素出现的次数，存入数组C的第i项；
对所有的计数累加（从C中的第一个元素开始，每一项和前一项相加）；
反向填充目标数组：将每个元素i放在新数组的第C(i)项，每放一个元素就将C(i)减去1。

先假设 20 个数列为：{9, 3, 5, 4, 9, 1, 2, 7, 8，1，3, 6, 5, 3, 4, 0, 10, 9, 7, 9}。
让我们先遍历这个无序的随机数组，找出最大值为 10 和最小值为 0。这样我们对应的计数范围将是 0 ~ 10。然后每一个整数按照其值对号入座，对应数组下标的元素进行加1操作。比如第一个整数是 9，那么数组下标为 9 的元素加 1，如下图所示。

下标	0	1	2	3	4	5	6	7	8	9	10
计数	0	0	0	0	0	0	0	0	0	1	0

第二个整数是 3，那么数组下标为 3 的元素加 1，如下图所示。

下标	0	1	2	3	4	5	6	7	8	9	10
计数	0	0	0	1	0	0	0	0	0	1	0

继续遍历数列并修改数组……。最终，数列遍历完毕时，数组的状态如下图。

计数数组：count

下标	0	1	2	3	4	5	6	7	8	9	10
计数	1	2	1	3	2	2	1	2	1	4	1

累计数组：count

下标	0	1	2	3	4	5	6	7	8	9	10
计数	1	3	4	7	9	11	12	14	15	19	20

最终结果：output

0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19
0	1	1	2	3	3	3	4	4	5	5	6	7	7	8	9	9	9	9	10

数组中的每一个值，代表了数列中对应整数的出现次数。有了这个统计结果，排序就很简单了，直接遍历数组，输出数组元素的下标值，元素的值是几，就输出几次。比如统计结果中的 1 为 2，就是数列中有 2 个 1 的意思。这样我们就得到最终排序好的结果。

代码如下：

/**************************************************************** 
 * Description: C++ implementation for counting Sort
 * Author: Alex Li
 * Date: 2023-03-21 15:42:49
 * LastEditTime: 2024-06-10 11:43:00
****************************************************************/

#include <iostream>
#include <vector>
using namespace std;

void countSort(int array[], int size) {
  // 寻找最大的元素 
  int max = array[0];
  for (int i = 1; i < size; i++) {
    if (array[i] > max)
      max = array[i];
  }
  vector<int> output(max+1);
  vector<int> count(max+1,0);  //大小为max+1，初始值是0
  
  // 统计每个数的个数
  for (int i = 0; i < size; i++) count[array[i]]++;

  // 统计计数的累计值，
  for (int i = 1; i <= max; i++)count[i] += count[i - 1];
  
  //将元素按顺序放到output数组里
  for (int i = 0; i <=size; i++) {
    output[count[array[i]] - 1] = array[i];
    count[array[i]]--;
  }
//将结果放回原数组array
  for (int i = 0; i < size; i++) {
    array[i] = output[i];
  }
}

// 打印排好序的数组
void printArray(int array[], int size) {
  for (int i = 0; i < size; i++)
    cout << array[i] << " ";
  cout << endl;
}

//主函数
int main() {
  int array[] = {4, 2, 2, 8, 3, 3, 1};
  int n = sizeof(array) / sizeof(array[0]);
  countSort(array, n);
  printArray(array, n);
}

算法复杂度和稳定性：

平均时间复杂度是O(n+w)，最坏时间复杂度是O(n+w)，空间复杂度O(n+w)，w为值域的规模，稳定。

计数排序的局限性：

虽然计数排序看上去很强大，但是它存在两大局限性：
1.当数列最大最小值差距过大时，并不适用于计数排序，比如给定 20 个随机整数，范围在 0 到 1 亿之间，此时如果使用计数排序的话，就需要创建长度为 1 亿的数组，不但严重浪费了空间，而且时间复杂度也随之升高。
2.当数列元素不是整数时，并不适用于计数排序，如果数列中的元素都是小数，比如 3.1415，或是 0.00000001 这样子，则无法创建对应的统计数组，这样显然无法进行计数排序。

Previous Topic

Back to Lesson

Next Topic

数据结构与算法

计数排序(Counting sort)