Java集合框架中的集合类与多线程操作

不会立即抛 ConcurrentModificationException,而是在迭代时检测到 modCount 不一致才抛出;多线程直接 add() 可能导致数组越界、元素覆盖或结果丢失。

ArrayList 在多线程下直接 add() 会抛 ConcurrentModificationException 吗?

不会立即抛 ConcurrentModificationException,但大概率在迭代时崩溃。这个异常不是在写操作(如 add())时触发,而是在后续调用 iterator().next()forEach() 等遍历方法检测到结构被并发修改时才抛出。

  • ArrayListmodCount 字段记录结构性修改次数,Iterator 持有初始 expectedModCount,不一致即触发异常
  • 多个线程同时 add() 可能导致数组越界、元素覆盖或 NullPointerException,因为 add() 不是原子操作:先检查容量 → 扩容(可能复制数组)→ 写入元素
  • 即使没抛异常,结果也是不可预测的——比如两个线程同时 add("a"),最终可能只插入一个,或数组处于中间状态

哪些 Java 集合类天生支持多线程安全?

真正线程安全的集合类极少,且各有适用边界。注意“线程安全”仅指单个操作原子,不等于复合操作自动安全。

  • VectorStack:所有 public 方法加了 synchronized,但性能差、已基本被弃用
  • Hashtable:类似 Vectorget()put() 都同步,但不支持 null 键/值,且迭代仍需手动同步
  • ConcurrentHashMap:推荐首选,分段锁(JDK 7)或 cas + synchronized(JDK 8+),支持高并发读写,get() 无锁,put() 锁粒度为桶(bin)
  • CopyOnWriteArrayList:写操作复制整个数组,读操作完全无锁;适合读远多于写的场景(如监听器列表),但内存开销大、写延迟高

ConcurrentHashMap 的 computeIfAbsent() 为什么比 putIfAbsent() 更适合初始化缓存?

因为 computeIfAbsent() 能保证:键不存在时,只会执行一次传入的 mapping function;而 putIfAbsent() 无法避免重复构造值对象。

Map> cache = new ConcurrentHashMap<>();
// ❌ 可能多次 new ArrayList(),即使 key 已存在
cache.putIfAbsent("key", new ArrayList<>());

// ✅ 只有 key 真正不存在时,lambda 才执行一次
cache.computeIfAbsent("key", k -> new ArrayList<>());
  • computeIfAbsent() 内部对目标桶加锁,确保 mapping function 不会被并发调用多次
  • 若 mapping function 耗时(如查数据库、解析 JSON),重复执行会造成资源浪费甚至业务错误
  • 注意:mapping function 内不能调用该

    map 的其他写方法(如 put()),否则可能死锁

用 Collections.synchronizedList() 包装 ArrayList 还需要额外同步吗?

需要。包装后单个方法(如 add()get())是线程安全的,但复合操作(如“检查是否存在再添加”)仍是竞态点。

List list = Collections.synchronizedList(new ArrayList<>());
// ❌ 以下三行不是原子操作:可能两个线程同时通过 if 判断,都执行 add()
if (!list.contains("x")) {
    list.add("x"); // ← 中间可能被其他线程插入 "x"
}
  • 必须用 synchronized(list) 显式包裹整个逻辑块
  • 迭代时也必须手动同步,否则仍可能抛 ConcurrentModificationExceptionsynchronized(list) { for (String s : list) { ... } }
  • 这种包装只是“语法糖”,底层仍是粗粒度锁,吞吐量不如 ConcurrentHashMapCopyOnWriteArrayList
实际并发集合选型,关键不在“是否线程安全”,而在“你的访问模式是什么”:是高频读+偶发写?还是读写均衡?是否需要弱一致性保证?这些细节一旦忽略,表面安全的代码照样在线上崩得悄无声息。