Java并发编程基础

基础概念

进程、线程与虚拟线程

进程是程序的运行态，磁盘上静态的程序被 OS 加载进内存并分配所需的系统资源，包括如 CPU 时间、IO、堆栈和寄存器状态等一系列环境，这个过程便是在创建一个进程。

进程之间互相独立，拥有自己的地址空间，所以当一个进程崩溃时，通常对其他进程毫无影响。

进程是 OS 进行资源分配的最小单位，但其创建和销毁等需要较大的系统开销，若是系统中存在大量的进程，调度时它们之间的切换便会消耗大量时间。

线程是进程中更小的执行单元，同一进程内的线程共享堆和方法区，但拥有独立的程序计数器和栈。线程属于进程，一个进程通常包含多个线程，所有线程共享该进程的资源。

线程是 OS 最小的调度单位，同一进程的多个线程可同时在 CPU 的不同核心上运行。

由于多个线程共享同一进程的资源，所以同属一个进程的线程之间通信十分方便，但也因此容易互相影响，一个线程崩溃很容易导致其他线程崩溃。

相较于进程，线程的创建和销毁所造成的系统开销较小，调度时的上下文切换也更快。

Java 程序从 main() 方法启动后就会开启一个 JVM 进程，进程中可创建多个线程（例如通过 new Thread() 或线程池），而在现代 JVM 中，Java 线程一般映射为操作系统的内核线程（采用一对一模型）。

虚拟线程的正式版由 JDK21 正式发布，是更轻量级的线程实现，虚拟线程同一由 JVM 进行管理，而非 OS。

虚拟线程与 OS 线程并非一一对应，而是一个 OS 线程可能对应多个虚拟线程，并且这种对应关系并非绑定的，若是一个线程比较空闲，其他的虚拟线程可以将其作为载体进行工作，从而提高 CPU 利用率。

虚拟线程是用户态的，它的创建、销毁和调度等需要的系统开销相比于 OS 线程更少，因此虚拟线程可以大量存在却不占据大量系统资源，因此大大提高了系统的并发性。

并发与并行

并发：多个任务在同一时间段内交替执行；
并行：多个任务在同一时刻真正同时执行（多核环境下）。

线程安全：一个类或方法在多线程环境中，如果不需要额外同步就能保证数据的一致性，就称为线程安全；反之，则可能产生竞态条件和数据不一致问题。

线程生命周期与上下文切换

线程状态主要包括：NEW、RUNNABLE、BLOCKED、WAITING、TIMED_WAITING 和 TERMINATED。
上下文切换指操作系统在不同线程间保存和恢复状态的过程，由于保存/恢复上下文需要 CPU 开销，频繁切换会降低效率。

创建线程

实现方式

new Thread(){...}; 来创建一个新的线程，通过以下方法来分配任务

继承 Thread 并重写 run() 可分配任务给线程执行
实现 Runnable 接口，然后作为参数传入 Thread() 中，以此来分配任务
创建线程池，将任务投入线程池中

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
// 实现 Runnable
public class MyRunnable implements Runnable {  
  
    @Override  
    public void run() {  
        System.out.println("MyRunnable is running");  
    }  
}

// 继承 Thread 
public class MyThread extends Thread {  
  
    @Override  
    public void run() {  
        System.out.println("MyThread is running");  
    }  
}

在主线程尝试运行

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
public class App {  
    public static void main(String[] args) throws Exception {  
        MyThread t1 = new MyThread();  
        t1.start();  
  
        Thread thread = new Thread(new MyRunnable());  
        thread.start();  
  
        System.out.println("主线程执行中...");  
    }  
}

// 输出：
// MyThread is running
// 主线程执行中...
// MyRunnable is running

可以看见三个线程的执行顺序并不相同

而在某些场景下，有时候线程用完即弃，并不考虑复用，我们可以使用匿名类和 Lambda 表达式来更方便地创建线程，示例如下：

匿名

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
new Thread() {  
    @Override  
    public void run() {  
        System.out.println("匿名线程1启动...");  
    }  
}.start();  
  
new Thread(new Runnable() {  
    @Override  
    public void run() {  
        System.out.println("匿名线程2启动...");  
    }  
}).start();

Lambda 表达式

1
2
3
new Thread(() -> System.out.println("匿名线程1启动...")).start();
  
new Thread(() -> System.out.println("匿名线程2启动...")).start();

此时两个线程直接传入的就是“做什么”，这样代码更加简洁明了

区别与联系

区别

继承的方式：
- 类本身变成线程的一部分，与线程紧密耦合，扩张性和灵活性都受到极大的限制
- 每创建一个类的实例，就是创建一个线程，当大量实例被创建时，将极大地占用系统资源
实现接口的方式：
- 类封装的是线程的任务，可将类实例传给其他线程或线程池，可提高线程复用率的同时，让任务的执行更加灵活
- 抽象层面上，这种方式更好地遵循了面向对象的设计原则，使得代码更加模块化和易于维护

联系

二者目的相同，都是为了让线程完成某一任务
两种方法创建的线程无本质区别，都遵循相同的启动流程和生命周期

为什么不能直接 run()

因为 run() 是同步方法，直接调用该方法，会是当前线程去执行任务，需要等待代码执行到调用 run() 的时候，当前线程才真正地执行 run() 里定义的任务而 Thread.start() 后，线程进入可执行状态，一旦获得 CPU 时间片，将立即执行 run() 中的代码，并且start() 只能被执行一次

2. Java 内存模型（JMM）

主要内容 JMM 定义了线程之间共享变量的访问规则、内存可见性和有序性，并引入了 happens-before 规则来确保同步操作的正确性。
happens-before 规则程序顺序规则、锁定规则、volatile 规则、线程启动规则、线程终结规则等，确保在同步代码块中写入的内容对后续获取同一锁的线程可见。
主内存与工作内存所有共享变量存放在主内存中，线程各自有自己的工作内存，读写共享变量时必须进行主内存与工作内存之间的交互。

并发控制机制

基于锁的并发控制

synchronized

隐式的对象锁，使用简单、语法简洁、自动释放锁，能保证互斥和可见性；
缺点是功能较弱（如不能中断等待、无法精细控制锁的释放）且在竞争激烈时可能导致性能瓶颈。
锁升级机制：
1. 初始状态：无锁/偏向锁状态
2. 偏向锁：
  - 当对象处于无竞争状态时，JVM会让第一个获取锁的线程将对象标记为“偏向”于它，此后该线程再次进入同步代码块无需额外CAS操作。
  - 如果其他线程尝试竞争这个锁，JVM首先会撤销偏向锁，将锁升级为轻量级锁。
3. 轻量级锁：
  - 偏向锁撤销后，JVM通过CAS机制在对象头中记录当前线程的锁记录，将锁升级为轻量级锁。
  - 适用于竞争不激烈时，通过自旋获取锁而避免线程阻塞。但如果竞争依然激烈（例如CAS反复失败），则会升级为重量级锁。
4. 重量级锁：
  - 当自旋竞争失败或等待时间过长时，轻量级锁会膨胀为重量级锁，此时采用操作系统互斥量来实现阻塞式同步，进入的线程会真正被挂起，直到锁被释放。

Lock 接口及其实现

最常用的实现，ReentrantLock：支持可重入（同一线程可多次获得同一锁）、中断响应（lockInterruptibly()）、尝试获取锁（tryLock()，可设置超时）以及公平/非公平两种策略；
ReentrantReadWriteLock：提供一对相关的锁，读锁允许多个线程同时读，但当有线程获得写锁时，读锁请求会被阻塞，此时写操作独占，可提高读多写少场景的并发性能；

StampedLock

Java8 引入，相对于 ReentrantReadWriteLock 提供更细粒度的控制，它支持三种模式：写锁、悲观读锁以及乐观读锁，提高读操作效率（但使用上较为复杂）；
虽然 StampedLock 并不直接实现 Lock 接口，但它提供了一套类似于 Lock 的 API，用于实现高效的读写控制和乐观锁定；

两阶段锁协议（2PL）

事务在执行时先进入扩展阶段（不断申请锁）再进入收缩阶段（释放锁），确保调度与某个串行执行等价；
严格2PL要求写锁直到事务结束才释放，以防止脏读。

Lock 与 synchronized 的区别

使用方式与灵活性
- synchronized
  - 是 Java 语言内置的关键字，使用简单（通过修饰方法或代码块实现同步），并且在异常发生时自动释放锁。
  - 受限于语言结构，不能指定等待时间、响应中断或创建多个条件变量。
- Lock 接口
  - 是基于 API 的显式锁，使用时必须手动调用 lock() 获取锁，通常在 finally 块中调用 unlock() 释放锁。
  - 提供更多灵活特性：例如 tryLock()（带超时），lockInterruptibly()（可以被中断），以及可以通过 newCondition() 创建多个 Condition 以实现更细粒度的线程通信。
中断响应
- synchronized 无法响应中断，即一旦进入同步代码块，线程除非执行完毕或抛出异常，否则不能被中断。
- Lock 接口（如 ReentrantLock）的 lockInterruptibly() 方法可以让等待锁的线程响应中断，从而更灵活地处理阻塞情况。
公平性
- synchronized 的锁由 JVM 管理，通常是非公平的（具体行为依赖于 JVM 实现）。
- ReentrantLock 可以通过构造方法指定公平策略，使得等待时间较长的线程能优先获得锁。
性能和扩展性
- 早期版本中 synchronized 的性能较低，但随着 JVM 的优化（如偏向锁、轻量级锁）在 JDK 6 以后，其性能已大为提升。
- Lock 提供了更多扩展和控制能力，特别在高并发场景下，当需要复杂的锁调度和条件控制时，Lock（及其 Condition）可以提供更好的解决方案。

Synchronized 的使用

同步实例方法

在类的实例方法上直接加上 synchronized 修饰符，相当于对当前对象（this）加锁，这样，同一时刻只有一个线程可以执行该方法，其他线程必须等待锁释放后才能进入。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
public class Counter {
    private int count = 0;

    // 同步实例方法，锁住的是当前对象实例
    public synchronized void increment() {
        count++;
    }

    public int getCount() {
        return count;
    }
}

在这种方式下，如果多个线程对同一个对象调用 increment() 方法，只有获得锁的线程能够执行，其他线程需要等待，从而确保对共享变量 count 的操作是线程安全的。

同步静态方法

当使用 synchronized 修饰静态方法时，锁定的是该类的 Class 对象，这意味着对该类的所有实例而言，同一时刻只有一个线程可以执行该静态同步方法。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
public class SharedCounter {
    private static int count = 0;

    // 同步静态方法，锁住的是 SharedCounter.class
    public static synchronized void increment() {
        count++;
    }

    public static int getCount() {
        return count;
    }
}

这种方式确保了即使创建了多个对象实例，静态方法的调用也能保持线程安全。

同步代码块

使用 synchronized 代码块可以更灵活地控制锁的范围和锁定对象，通过指定一个对象作为锁，只有获得该对象锁的线程才能进入同步代码块。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
public class Counter {
    private final Object lock = new Object();
    private int count = 0;

    public void increment() {
        // 使用自定义锁对象进行同步
        synchronized (lock) {
            count++;
            // 其他需要线程安全环境的代码
        }
    }
}

利用同步代码块可以避免将整个方法都标记为同步，从而提高并发性能，也提升了代码灵活性，让我们可以根据实际需要选择合适的锁对象，比如 this、某个类的 Class 对象或自定义的锁对象来控制同步粒度。

基于 CAS 和原子类

CAS 操作
- CAS（Compare-And-Swap）是一种无锁算法，利用硬件提供的原子操作指令实现对变量的更新；
- 常见问题包括 ABA 问题，解决办法有 AtomicStampedReference 等。
java.util.concurrent.atomic 包
- 提供 AtomicInteger、AtomicLong、AtomicReference 等类，用于实现简单数据类型和引用的原子操作；
- 当线程争用激烈时，CAS 的自旋可能导致较高的 CPU 消耗，这时可以考虑 LongAdder 等更适合高并发计数的方案。

并发容器与工具类

并发集合

ConcurrentHashMap：JDK 7 使用分段锁机制，JDK 8 采用 CAS + synchronized（数组+链表+红黑树）实现，线程安全且具有较高的并发性。
CopyOnWriteArrayList / CopyOnWriteArraySet：写操作时复制数组，读操作无锁，适合读多写少的场景；
ConcurrentLinkedQueue：基于无锁CAS设计的队列，适用于高并发场景下的非阻塞队列。
BlockingDeque：支持双端操作的阻塞队列。

J.U.C 同步工具

ReentrantLock

用法

ReentrantLock 是一种显式锁，相对于 synchronized 关键字，它提供了更多的灵活性（例如可中断锁请求、公平锁等）。基本用法如下：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
public class Counter {
    private int count = 0;
    private final ReentrantLock lock = new ReentrantLock();

    public void increment() {
        lock.lock();
        try {
            count++;
        } finally {
            lock.unlock();
        }
    }

    public int getCount() {
        return count;
    }
}

原理

重入性：同一线程可以多次获得锁而不会死锁。
公平性：可以通过构造函数指定是否采用公平策略，使等待时间最长的线程优先获得锁。
可中断性：调用 lockInterruptibly() 方法时，如果线程在等待锁过程中被中断，可以抛出 InterruptedException。

CountDownLatch

用法

CountDownLatch 用于使一个或多个线程等待其他线程完成一组操作。常用于主线程等待多个子线程执行完毕。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
public class WorkerDemo {
    public static void main(String[] args) throws InterruptedException {
        int workerCount = 3;
        CountDownLatch latch = new CountDownLatch(workerCount);

        for (int i = 0; i < workerCount; i++) {
            new Thread(() -> {
                // 模拟任务处理
                System.out.println("任务开始：" + Thread.currentThread().getName());
                try {
                    Thread.sleep(1000);
                } catch (InterruptedException e) {
                    Thread.currentThread().interrupt();
                }
                System.out.println("任务结束：" + Thread.currentThread().getName());
                latch.countDown();
            }).start();
        }

        // 等待所有线程完成任务
        latch.await();
        System.out.println("所有任务已完成！");
    }
}

原理

内部维护一个计数器，每调用一次 countDown()，计数器减一；
当计数器归零时，所有等待的线程将被唤醒继续执行。
适合用于一次性任务的同步，不可重用。

CyclicBarrier

用法

CyclicBarrier 用于让一组线程互相等待，直到所有线程都到达某个公共屏障点后再继续执行。常见应用包括多线程并行计算，最后结果汇总：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
public class BarrierDemo {
    public static void main(String[] args) {
        int threadCount = 3;
        CyclicBarrier barrier = new CyclicBarrier(threadCount, () -> {
            System.out.println("所有线程已到达屏障，开始执行汇总任务");
        });

        for (int i = 0; i < threadCount; i++) {
            new Thread(() -> {
                System.out.println("线程" + Thread.currentThread().getName() + "正在执行任务");
                try {
                    Thread.sleep((long) (Math.random() * 1000));
                    System.out.println("线程" + Thread.currentThread().getName() + "等待中...");
                    barrier.await();
                } catch (InterruptedException | BrokenBarrierException e) {
                    e.printStackTrace();
                }
            }).start();
        }
    }
}

原理

内部计数器记录等待的线程数；
当所有线程都调用了 await() 方法时，计数器归零，并触发预设的屏障动作（如果有）；
屏障在使用完毕后可以重用（即“循环”屏障）。

Semaphore

Semaphore 用于控制同时访问特定资源的线程数量，相当于一个计数信号量。典型用法如限制并发访问数据库连接池或共享设备：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
public class SemaphoreDemo {
    // 假设只许可三个
    private final Semaphore semaphore = new Semaphore(3);

    public void accessResource() {
        try {
            semaphore.acquire();
            System.out.println(Thread.currentThread().getName() + " 获取许可，正在访问资源");
            Thread.sleep(500);
        } catch (InterruptedException e) {
            Thread.currentThread().interrupt();
        } finally {
            System.out.println(Thread.currentThread().getName() + " 释放许可");
            semaphore.release();
        }
    }

    public static void main(String[] args) {
        SemaphoreDemo demo = new SemaphoreDemo();
        for (int i = 0; i < 6; i++) {
            new Thread(demo::accessResource).start();
        }
    }
}

原理

内部维护一个许可计数器；
acquire() 操作会减少许可数，若许可数为0，则线程进入等待状态；
release() 操作会增加许可数，并唤醒等待线程。
适用于资源访问限制和流量控制等场景。

BlockingQueue

用法

BlockingQueue 是一种支持阻塞操作的队列，广泛应用于生产者-消费者模型。常见实现包括 ArrayBlockingQueue、LinkedBlockingQueue、PriorityBlockingQueue 等。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
public class BlockingQueueDemo {
    public static void main(String[] args) {
        BlockingQueue<Integer> queue = new ArrayBlockingQueue<>(5);

        // 生产者线程
        new Thread(() -> {
            for (int i = 0; i < 10; i++) {
                try {
                    queue.put(i);  // 队列满时阻塞
                    System.out.println("生产了：" + i);
                } catch (InterruptedException e) {
                    Thread.currentThread().interrupt();
                }
            }
        }).start();

        // 消费者线程
        new Thread(() -> {
            for (int i = 0; i < 10; i++) {
                try {
                    int num = queue.take();  // 队列空时阻塞
                    System.out.println("消费了：" + num);
                } catch (InterruptedException e) {
                    Thread.currentThread().interrupt();
                }
            }
        }).start();
    }
}

原理

内部通过锁与条件变量实现阻塞与唤醒机制；
当队列为空时，调用 take() 的线程会被阻塞，直到队列中有数据；
当队列满时，调用 put() 的线程会被阻塞，直到有空间可用；
保证了生产者和消费者之间的协调与数据安全。

Future 和线程池

ThreadPoolExecutor

J.U.C 包中最常用的线程池实现，通过复用线程来降低线程创建和销毁的开销，提高响应速度，并通过统一管理线程来更好地控制并发任务的执行

核心构造参数

创建 ThreadPoolExecutor 时，通常需要设置以下六个主要参数：

corePoolSize：核心线程数，线程池中始终保持运行的线程数量。任务被提交至线程池中时，若当前线程数小于该值，就直接创建新线程执行任务
maximumPoolSize：线程池允许的最大线程数。当任务队列已满，但当前线程数还未达到这个值，则还会继续创建新的线程
keepAliveTime：非核心线程空闲存活的时间，超过这个时间且无任务可取时，线程将被终止。如果调用了 allowCoreThreadTimeOut(true)，核心线程也会遵循该策略
workQueue：任务队列，用于存放等待执行的任务。常见的有 ArrayBlockingQueue（有界队列）、LinkedBlockingQueue（可选有界或无界）、SynchronousQueue（不存储任务）等
threadFactory：用于创建新线程，通常可以使用默认的线程工厂，也可自定义以设置线程名称、优先级等
handler：拒绝策略，当任务队列满且线程池中线程数达到 maximumPoolSize时，决定如何处理新提交的任务。常用策略包括 AbortPolicy、CallerRunsPolicy、DiscardPolicy 和 DiscardOldestPolicy

线程池的执行流程

ThreadPoolExecutor 提交任务的整体流程可以概括为三个步骤：

先创建核心线程 当提交任务时，如果当前运行的线程数小于 corePoolSize，线程池会立即创建新线程来执行任务
任务入队 当核心线程数达到 corePoolSize 时，新的任务将首先被放入 workQueue 队列中等待执行。此时队列通常是阻塞队列，例如无界的 LinkedBlockingQueue（FixedThreadPool 和 SingleThreadExecutor 默认采用）
扩容与拒绝 如果队列已满，则线程池会尝试创建新的线程（前提是当前线程数还小于 maximumPoolSize）。若线程数已达 maximumPoolSize 并且任务依然无法入队，则触发拒绝策略，按照预设的 handler 对任务进行处理，如抛出异常或让调用者执行任务

使用注意与最佳实践

参数配置：合理设置 corePoolSize、maximumPoolSize、keepAliveTime 以及队列大小，对系统性能至关重要。比如 CPU 密集型任务建议线程数设置为 CPU 核数+1，而 IO 密集型任务可以适当调大线程数
避免使用 Executors 工具类：虽然 Executors 提供了简便的方法创建线程池，但其默认的线程池实现（如 newFixedThreadPool、newCachedThreadPool）存在使用无界队列或无限制线程数的问题，容易导致资源耗尽。建议直接使用 ThreadPoolExecutor 构造函数进行精细控制
监控与调优：可以通过覆盖 beforeExecute()、afterExecute() 方法和定期监控线程池状态，及时调整线程池参数，确保系统稳定运行。

Executor 和 ExecutorService

提供了基于线程池管理任务执行的框架，避免频繁创建销毁线程的开销。

用法

Executor 框架主要用于线程池管理，避免频繁创建销毁线程带来的开销。最常用的是 ThreadPoolExecutor 以及通过 Executors 工具类创建的各种线程池（如固定线程池、缓存线程池、单线程池等）。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
public class ExecutorDemo {
    public static void main(String[] args) {
        // 新建一个固定线程池
        ExecutorService executor = Executors.newFixedThreadPool(3);

        for (int i = 0; i < 10; i++) {
            executor.execute(() -> {
                System.out.println("任务执行：" + Thread.currentThread().getName());
            });
        }
        // 关闭线程池
        executor.shutdown();
    }
}

原理

任务队列：提交的任务会先放入阻塞队列中；
线程复用：线程池中的线程不断从队列中取任务执行，任务执行完后线程不会销毁，而是等待下一个任务；
扩展策略：可以配置核心线程数、最大线程数、空闲线程存活时间等参数，从而控制资源使用与任务处理效率。

其他

Future、Callable、FutureTask：用于提交可返回值的任务，支持任务取消、阻塞获取任务结果等。
ScheduledExecutorService：支持延迟执行和周期性任务调度。
Fork/Join 框架：利用分治算法并行执行任务，采用工作窃取策略，是利用多核 CPU 进行并行计算的有效工具。