深入理解死锁：多线程编程中的隐形陷阱

在并发编程中，死锁（Deadlock）是最令人头疼的问题之一。它如同交通堵塞中的僵局，多个线程互相等待对方释放资源，导致所有线程都无法继续执行，程序陷入永久停滞状态。

什么是死锁？

死锁是指两个或多个线程在执行过程中，因争夺资源而造成的一种互相等待的现象。当这些线程都无法继续执行时，系统就处于死锁状态。

用一个生动的比喻来解释：假设有两条单行道的十字路口，四辆车同时到达路口。按照交通规则，每辆车都需要让行右侧车辆，结果所有车都在等待其他车先通过，最终导致交通完全瘫痪。

死锁产生的四个必要条件

死锁的发生必须同时满足以下四个条件，缺一不可：

1. 互斥条件（Mutual Exclusion）

资源一次只能被一个线程使用。如果其他线程请求该资源，请求线程必须等待直到资源被释放。

2. 持有并等待（Hold and Wait）

线程已经持有至少一个资源，但又等待获取其他线程持有的额外资源。

3. 不可剥夺条件（No Preemption）

资源只能由持有它的线程自愿释放，不能被强制剥夺。

4. 循环等待（Circular Wait）

存在一个线程资源的循环等待链，每个线程都在等待下一个线程所持有的资源。

死锁的代码示例

下面是一个典型的死锁示例，展示了两个线程互相等待对方释放锁的场景：

#include <iostream>
#include <thread>
#include <mutex>

std::mutex mutex1;
std::mutex mutex2;

void thread1_function() {
    std::cout << "Thread 1: Trying to lock mutex1..." << std::endl;
    std::lock_guard<std::mutex> lock1(mutex1);
    std::cout << "Thread 1: Locked mutex1." << std::endl;
    
    // 模拟一些工作
    std::this_thread::sleep_for(std::chrono::milliseconds(100));
    
    std::cout << "Thread 1: Trying to lock mutex2..." << std::endl;
    std::lock_guard<std::mutex> lock2(mutex2); // 这里会发生死锁
    std::cout << "Thread 1: Locked mutex2." << std::endl;
    
    std::cout << "Thread 1: Doing work with both mutexes..." << std::endl;
}

void thread2_function() {
    std::cout << "Thread 2: Trying to lock mutex2..." << std::endl;
    std::lock_guard<std::mutex> lock2(mutex2);
    std::cout << "Thread 2: Locked mutex2." << std::endl;
    
    // 模拟一些工作
    std::this_thread::sleep_for(std::chrono::milliseconds(100));
    
    std::cout << "Thread 2: Trying to lock mutex1..." << std::endl;
    std::lock_guard<std::mutex> lock1(mutex1); // 这里会发生死锁
    std::cout << "Thread 2: Locked mutex1." << std::endl;
    
    std::cout << "Thread 2: Doing work with both mutexes..." << std::endl;
}

int main() {
    std::thread t1(thread1_function);
    std::thread t2(thread2_function);
    
    t1.join();
    t2.join();
    
    std::cout << "Program completed successfully." << std::endl;
    return 0;
}

运行这个程序，你很可能会发现程序永远不会输出”Program completed successfully.”，因为两个线程陷入了死锁。

死锁的解决方案

1. 预防死锁（Deadlock Prevention）

通过破坏死锁的四个必要条件中的一个或多个来预防死锁：

破坏互斥条件：让资源可共享（但很多资源本质就是不可共享的）
破坏持有并等待条件：要求线程一次性获取所有需要的资源
破坏不可剥夺条件：允许系统强制收回已分配的资源
破坏循环等待条件：对资源进行排序，要求按顺序申请资源

2. 避免死锁（Deadlock Avoidance）

系统在分配资源时先判断是否会导致死锁，只有安全时才分配。

银行家算法：系统检查资源分配状态，确保至少有一个线程能完成

3. 检测与恢复（Detection and Recovery）

允许死锁发生，但定期检测并采取措施恢复。

资源分配图：检测系统中是否存在环路
恢复机制：终止进程或剥夺资源

实用的死锁避免技巧

1. 固定的锁获取顺序

确保所有线程以相同的顺序获取锁：

// 所有线程都按照先mutex1后mutex2的顺序获取锁
void safe_function() {
    std::lock_guard<std::mutex> lock1(mutex1);
    std::lock_guard<std::mutex> lock2(mutex2);
    // 安全地使用资源
}

2. 使用std::lock同时获取多个锁

C++标准库提供了同时锁定多个互斥量的方法：

void safe_function() {
    std::unique_lock<std::mutex> lock1(mutex1, std::defer_lock);
    std::unique_lock<std::mutex> lock2(mutex2, std::defer_lock);
    std::lock(lock1, lock2); // 同时锁定，避免死锁
    // 安全地使用资源
}

3. 使用层次锁（Hierarchical Locking）

如我们在上一篇博客介绍的，通过定义锁的层次结构来预防死锁。

4. 超时机制

使用try_lock_for或try_lock_until尝试获取锁，避免无限期等待：

void timeout_function() {
    std::unique_lock<std::mutex> lock1(mutex1, std::defer_lock);
    if (lock1.try_lock_for(std::chrono::milliseconds(100))) {
        // 成功获取锁
        std::unique_lock<std::mutex> lock2(mutex2, std::defer_lock);
        if (lock2.try_lock_for(std::chrono::milliseconds(100))) {
            // 成功获取两个锁
        } else {
            // 超时，释放已获取的锁并处理失败
        }
    } else {
        // 超时，处理失败
    }
}

死锁检测工具

在实际开发中，可以使用一些工具来检测死锁：

静态分析工具：如Clang静态分析器、Coverity等
动态分析工具：如Helgrind、ThreadSanitizer等
调试器：使用gdb等调试器分析线程状态

总结

死锁是多线程编程中的常见问题，但通过理解其产生原因和必要条件，我们可以采取有效的预防和避免措施。关键要点包括：

总是以固定的全局顺序获取锁
使用RAII管理锁的生命周期
尽量避免嵌套锁，或者使用std::lock同时获取多个锁
考虑使用超时机制避免无限期等待
使用层次锁等高级技术强制锁获取顺序

在实际开发中，良好的设计、严格的编码规范和适当的工具使用是避免死锁的关键。通过遵循这些原则，我们可以编写出更加健壮和可靠的多线程程序。

并发

深入理解死锁：多线程编程中的隐形陷阱

https://www.psnow.sbs/2025/09/20/深入理解死锁：多线程编程中的隐形陷阱/

作者

Psnow

发布于

2025年9月20日

许可协议

C++层次锁结构：彻底解决死锁的优雅方案上一篇

实现线程安全的堆栈：解决多线程中的数据竞争问题下一篇