计数排序(Counting sort)

组别:入门级
难度:3

算法描述:
找出待排序的数组中最大和最小的元素;
统计数组中每个值为i的元素出现的次数,存入数组C的第i项;
对所有的计数累加(从C中的第一个元素开始,每一项和前一项相加);
反向填充目标数组:将每个元素i放在新数组的第C(i)项,每放一个元素就将C(i)减去1。

先假设 20 个数列为:{9, 3, 5, 4, 9, 1, 2, 7, 8,1,3, 6, 5, 3, 4, 0, 10, 9, 7, 9}。
让我们先遍历这个无序的随机数组,找出最大值为 10 和最小值为 0。这样我们对应的计数范围将是 0 ~ 10。然后每一个整数按照其值对号入座,对应数组下标的元素进行加1操作。 比如第一个整数是 9,那么数组下标为 9 的元素加 1,如下图所示。

下标012345678910
计数00000000010

第二个整数是 3,那么数组下标为 3 的元素加 1,如下图所示。

下标012345678910
计数00010000010

继续遍历数列并修改数组……。最终,数列遍历完毕时,数组的状态如下图。

计数数组:count

下标012345678910
计数12132212141

累计数组:count

下标012345678910
计数13479111214151920

最终结果:output

012345678910111213141516171819
011233344556778999910

数组中的每一个值,代表了数列中对应整数的出现次数。 有了这个统计结果,排序就很简单了,直接遍历数组,输出数组元素的下标值,元素的值是几,就输出几次。比如统计结果中的 1 为 2,就是数列中有 2 个 1 的意思。这样我们就得到最终排序好的结果。

代码如下:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
/**************************************************************** 
 * Description: C++ implementation for counting Sort
 * Author: Alex Li
 * Date: 2023-03-21 15:42:49
 * LastEditTime: 2024-06-10 11:43:00
****************************************************************/

#include <iostream>
#include <vector>
using namespace std;

void countSort(int array[], int size) {
  // 寻找最大的元素 
  int max = array[0];
  for (int i = 1; i < size; i++) {
    if (array[i] > max)
      max = array[i];
  }
  vector<int> output(max+1);
  vector<int> count(max+1,0);  //大小为max+1,初始值是0
  
  // 统计每个数的个数
  for (int i = 0; i < size; i++) count[array[i]]++;

  // 统计计数的累计值,
  for (int i = 1; i <= max; i++)count[i] += count[i - 1];
  
  //将元素按顺序放到output数组里
  for (int i = 0; i <=size; i++) {
    output[count[array[i]] - 1] = array[i];
    count[array[i]]--;
  }
//将结果放回原数组array
  for (int i = 0; i < size; i++) {
    array[i] = output[i];
  }
}

// 打印排好序的数组
void printArray(int array[], int size) {
  for (int i = 0; i < size; i++)
    cout << array[i] << " ";
  cout << endl;
}

//主函数
int main() {
  int array[] = {4, 2, 2, 8, 3, 3, 1};
  int n = sizeof(array) / sizeof(array[0]);
  countSort(array, n);
  printArray(array, n);
}

算法复杂度和稳定性:

平均时间复杂度是O(n+w),最坏时间复杂度是O(n+w),空间复杂度O(n+w),w为值域的规模,稳定。

计数排序的局限性:

虽然计数排序看上去很强大,但是它存在两大局限性:
1.当数列最大最小值差距过大时,并不适用于计数排序,比如给定 20 个随机整数,范围在 0 到 1 亿之间,此时如果使用计数排序的话,就需要创建长度为 1 亿的数组,不但严重浪费了空间,而且时间复杂度也随之升高。
2.当数列元素不是整数时,并不适用于计数排序,如果数列中的元素都是小数,比如 3.1415,或是 0.00000001 这样子,则无法创建对应的统计数组,这样显然无法进行计数排序。

Scroll to Top