一种不需要%的环形缓冲队列的实现

在做练习44的时候，在维基百科上面看到了一种不需要取模运算，而是利用异或、与实现的环形缓冲队列，比较有意思。

一般来说环形队列的写法都会疯狂取模%，比如判断环形队列是否队满，会写类似这样的代码：

cb->size-1 == ((cb->end - cb->beg + cb->size) % cb->size)

但是，取模运算%比较耗时，特别是对于Linux kernel这样的基础设施而言，所以Linux kernel采用了类似下面这样的实现：

// This approach adds one bit to end and start pointers
// Circular buffer object
typedef struct {
    int size; // maximum number of elements
    int start; // index of oldest element
    int end; // index at which to write new element
    ElemType *elems; // vector of elements
} CircularBuffer;

void cbInit(CircularBuffer *cb, int size) {
    cb->size = size;
    cb->start = 0;
    cb->end = 0;
    cb->elems = (ElemType *)calloc(cb->size, sizeof(ElemType));
}

void cbPrint(CircularBuffer *cb) {
    printf("size = 0x%x, start = %d, end = %d\n", cb->size, cb->start, cb->end);
}

int cbIsFull(CircularBuffer *cb) {
    return cb->end == (cb->start ^ cb->size); // This inverts the most significant bit of start before comparison
}

int cbIsEmpty(CircularBuffer *cb) {
    return cb->end == cb->start;
}

int cbIncr(CircularBuffer *cb, int p) {
    return (p + 1) & (2 * cb->size - 1); // start and end pointers incrementation is done modulo 2*size
}

void cbWrite(CircularBuffer *cb, ElemType *elem) {
    cb->elems[cb->end & (cb->size - 1)] = *elem;
    if (cbIsFull(cb)) // full, overwrite moves start pointer
        cb->start = cbIncr(cb, cb->start);
    cb->end = cbIncr(cb, cb->end);
}

void cbRead(CircularBuffer *cb, ElemType *elem) {
    *elem = cb->elems[cb->start & (cb->size - 1)];
    cb->start = cbIncr(cb, cb->start);
}

值得注意的是，其中这个环形队列的大小一定是2的幂次，这一点非常重要，是之后一切的前提。

可以看到，它是通过头指针异或队列大小 == 尾指针来判断队列是否已满，这里利用了异或是不进位二进制加法的性质，本该进位但没进位的那一位一定是队列大小为1的那一位（因为保证了队列大小一定是2的幂次，所以只有唯一一个1），因为没进位所以相当于原数加上队列长度再减去了队列大小的两倍，这里相当于做了一次对队列大小的两倍取模的操作，很巧妙。

至于为什么要取模队列长度*2，为什么指针的范围维护在[0,队列大小*2)，这是为了区分队满和队空的情况。如果指针范围为[0,队列大小)并且不保持一个存储单元为空的话，队满和队空都会导致头指针等于尾指针。一般的方案是保持一个存储单元为空，队空就是头指针等于尾指针，而队满就是头指针距离尾指针=队列大小-1。这样比较方便，但是浪费了一个空间，另外一个方案是将整个队列镜像复制到对尾拼在一起，比如abc|abc这样，实际数据还是只有abc，但是指针的范围扩大到abcabc，此时队空就是头指针等于尾指针，而队满就是头指针距离尾指针=队列大小，没有浪费空间而且解决了区别队空、队尾的难题。

然后再来看cbInc，这是用于前移指针的函数，& (2 * cb->size - 1)的效果也相当于是对指针做了一次对队列大小的两倍取模的操作（所以其实可以将上面判断队满改写为((cb->beg + cb->size) & (2*cb->size-1)) == cb->end）。

对环形队列的写入和读取时，指针还要记得& (cb->size - 1)，相当于对队列长度取模，（为什么还要取模？因为指针虽然在abc|abc，但是实际数据还是只在abc中）。值得注意的是，当队满仍要写入时，直接让头指针向前，让新的数据覆盖队首即可。

本文采用知识共享署名4.0国际许可协议(CC BY 4.0)进行许可