跳表（Skip List）原理与实现

字数 987 2025-11-04 20:48:29

跳表（Skip List）原理与实现

跳表是一种基于有序链表的高效数据结构，它通过添加多级索引来加速查找操作，能够在平均O(log n)时间复杂度内完成查找、插入和删除操作，且实现比平衡树更简单。

一、基础结构：有序链表的局限性

普通有序链表每个节点只保存下一个节点的指针
查找时需要从头到尾遍历，时间复杂度为O(n)
插入和删除操作虽然只需O(1)时间修改指针，但查找位置需要O(n)

二、跳表的核心思想：建立多级索引

第一级是原始有序链表，包含所有元素
第二级索引从第一级中"跳过"部分节点抽取形成（如每隔1个节点抽一个）
第三级索引从第二级中间隔抽取，以此类推
最高级索引通常只有2-4个节点，形成"金字塔"结构

三、具体实现步骤

查找操作流程：

从最高级索引开始查找
在当前层级向右遍历，直到下一个节点值大于等于目标值
如果当前节点值等于目标值，查找成功
如果下一个节点值大于目标值，向下降一级索引
重复步骤2-4，直到找到目标或到达最低级仍未找到

插入操作流程：

使用查找操作找到应插入位置，记录查找路径中各层的前驱节点
创建新节点，随机确定其层级高度（常用抛硬币法：50%概率增加一层）
从低到高更新指针：
- 新节点的next指针指向原后继节点
- 各层前驱节点的next指针指向新节点
如果随机层级超过当前最大层级，更新跳表的最大层级

删除操作流程：

使用查找操作找到目标节点，同时记录各层前驱节点
从最高层开始，更新各层前驱节点的next指针，跳过被删除节点
如果删除后某层级变为空，可降低跳表的最大层级

四、关键技术与复杂度分析

层级随机化算法：

def random_level():
    level = 1
    while random.random() < 0.5 and level < MAX_LEVEL:
        level += 1
    return level

每个节点层级独立随机生成
期望层级数为2，保证索引规模可控

时间复杂度分析：

查找/插入/删除的平均时间复杂度：O(log n)
最坏情况（所有节点都在同一层级）：O(n)
通过调整随机概率参数可平衡时间与空间效率

空间复杂度分析：

额外索引空间：O(n)（期望每2个节点有1个索引，每4个节点有2级索引，形成几何级数）
实际空间消耗约为原始链表的2倍

五、与平衡树的对比优势

实现简单，代码量明显少于红黑树或AVL树
支持范围查询，与平衡树效率相当
并发环境下更容易实现线程安全版本
Redis等实际系统采用跳表实现有序集合

这种通过概率平衡而非严格平衡的设计思路，使跳表在工程实践中成为平衡树的优秀替代方案。

跳表（Skip List）原理与实现跳表是一种基于有序链表的高效数据结构，它通过添加多级索引来加速查找操作，能够在平均O(log n)时间复杂度内完成查找、插入和删除操作，且实现比平衡树更简单。一、基础结构：有序链表的局限性普通有序链表每个节点只保存下一个节点的指针查找时需要从头到尾遍历，时间复杂度为O(n) 插入和删除操作虽然只需O(1)时间修改指针，但查找位置需要O(n) 二、跳表的核心思想：建立多级索引第一级是原始有序链表，包含所有元素第二级索引从第一级中"跳过"部分节点抽取形成（如每隔1个节点抽一个）第三级索引从第二级中间隔抽取，以此类推最高级索引通常只有2-4个节点，形成"金字塔"结构三、具体实现步骤查找操作流程：从最高级索引开始查找在当前层级向右遍历，直到下一个节点值大于等于目标值如果当前节点值等于目标值，查找成功如果下一个节点值大于目标值，向下降一级索引重复步骤2-4，直到找到目标或到达最低级仍未找到插入操作流程：使用查找操作找到应插入位置，记录查找路径中各层的前驱节点创建新节点，随机确定其层级高度（常用抛硬币法：50%概率增加一层）从低到高更新指针：新节点的next指针指向原后继节点各层前驱节点的next指针指向新节点如果随机层级超过当前最大层级，更新跳表的最大层级删除操作流程：使用查找操作找到目标节点，同时记录各层前驱节点从最高层开始，更新各层前驱节点的next指针，跳过被删除节点如果删除后某层级变为空，可降低跳表的最大层级四、关键技术与复杂度分析层级随机化算法：每个节点层级独立随机生成期望层级数为2，保证索引规模可控时间复杂度分析：查找/插入/删除的平均时间复杂度：O(log n) 最坏情况（所有节点都在同一层级）：O(n) 通过调整随机概率参数可平衡时间与空间效率空间复杂度分析：额外索引空间：O(n)（期望每2个节点有1个索引，每4个节点有2级索引，形成几何级数）实际空间消耗约为原始链表的2倍五、与平衡树的对比优势实现简单，代码量明显少于红黑树或AVL树支持范围查询，与平衡树效率相当并发环境下更容易实现线程安全版本 Redis等实际系统采用跳表实现有序集合这种通过概率平衡而非严格平衡的设计思路，使跳表在工程实践中成为平衡树的优秀替代方案。