Java中基于多字段分组并配对合并对象列表的实用教程_技术教程

本文介绍如何使用java stream api和collectors对对象列表按多个字段（如name、type、subtype）进行嵌套分组，并将同一主键下不同subtype的元素两两配对生成二维列表，适用于报表汇总、数据对齐等场景。

在实际开发中，我们常需将扁平的对象列表按业务维度“聚类—配对—重组”。例如，给定一批具有 name、type、subType 三重标识的对象，目标是：先按 (name, type) 分组，再在每组内将 subType == "a" 和 subType == "b" 的对象一一配对，最终得到一个 List（每个数组长度为2，含a/b各一）。

直接使用多层嵌套 Map（如 Map>>）不仅可读性差、易出错，还难以维护。更优雅的方式是采用 两级分组 + 拉链式配对（zip） 策略：

✅ 步骤一：按主键分组（name + type）

首先定义复合键类（推荐使用 record 提升简洁性与不可变性）：

public record CompositeKey(String name, String type) {}

然后使用 Collectors.groupingBy 将原始列表按 CompositeKey 分组：

Map> groupedByMainKey = list.stream()
    .collect(Collectors.groupingBy(
        item -> new CompositeKey(item.getName(), item.getType())
    ));

✅ 步骤二：在每组内按 subType 拆分并配对

对每个 CompositeKey 对应的子列表，进一步按 subType 划分为 aList 和 bList，再通过索引或队列实现安全配对（自动对齐，忽略多余项）：

List result = new ArrayList<>();
for (List group : groupedByMainKey.values()) {
    // 按 subType 拆分
    Map> bySubType = group.stream()
        .collect(Collectors.groupingBy(Type1::getSubType));

    List aList = bySubType.getOrDefault("a", Collections.emptyList());
    List bList = bySubType.getOrDefault("b", Collections.emptyList());

    // 拉链配对：取 min(sizeA, sizeB) 对
    int pairCount = Math.min(aList.size(), bList.size());
    for (int i = 0; i < pairCount; i++) {
        result.add(new Type1[]{aList.get(i), bList.get(i)});
    }
}

? 关键说明：该方案天然支持不等长子列表（如某组有3个"a"但只有2个"b"，则只生成2对），避免 NullPointerException 或越界异常；若需严格要求成对存在，可在配对前校验 aList.size() == bList.size() 并抛出业务异常。

✅ 进阶：Stream 链式写法（函数式风格）

若追求极致简洁，可封装为工具方法：

public static  List zipBySubtypes(
        List items,
        Function nameFn,
        Function typeFn,
        Function subTypeFn,
        String subtypeA, String subtypeB) {

    return items.stream()
        .collect(Collectors.groupingBy(
            item -> new CompositeKey(nameFn.apply(item), typeFn.apply(item)),
            Collectors.collectingAndThen(
                Collectors.groupingBy(
                    subTypeFn,
                    Collectors.toList()),
                map -> {
                    List aList = map.getOrDefault(subtypeA, Collections.emptyList());
                    List bList = map.getOrDefault(subtypeB, Collections.emptyList());
                    int n = Math.min(aList.size(), bList.size());
                    return IntStream.range(0, n)
                        .mapToObj(i -> (T[]) new Object[]{aList.get(i), bList.get(i)})
                        .collect(Collectors.toList());
                }
            )
        ))
        .values()
        .stream()
        .flatMap(List::stream)
        .collect(Collectors.toList());
}