PHP 中合并数组重复项并累加计数字段(如 REPEAT)的完整教程

本文介绍如何在 php 中高效识别并合并关联数组中的重复项(基于指定字段),同时将重复项的 `repeat` 值累加至保留的唯一项中,适用于音乐播放列表等场景。

在处理数据库查询返回的播放列表数据时,常会遇到同一首歌曲(相同 ARTIST + TITLE + TIME)多次出现的情况。理想的数据结构应去重后保留一条记录,并将原始每条记录的 REPEAT(默认为 1)累加为总播放次数。例如:5 条完全相同的歌曲记录,应合并为 1 条,且 REPEAT => 5。

下面提供一个健壮、可读性强的解决方案:

✅ 推荐实现:使用哈希键聚合(时间复杂度 O(n),推荐)

相比原答案中每次遍历 array_filter 的 O(n²) 方案,更优解是利用「唯一标识键」进行一次遍历聚合:

function mergeDuplicateTracks(array $playlist, string $artistKey = 'ARTIST', string $titleKey = 'TITLE', string $timeKey = 'TIME', string $repeatKey = 'REPEAT'): array {
    $merged = [];
    $seenKeys = [];

    foreach ($playlist as $track) {
        // 构建唯一键:用 artist+title+time 组合(可按需增减字段)
        $key = $track[$artistKey] . '|' . $track[$titleKey] . '|' . $track[$timeKey];

        if (!isset($merged[$key])) {
            // 首次出现:深拷贝原始项,并初始化 REPEAT(确保存在)
            $merged[$key] = [
                'ID'     => $track['ID'] ?? null,
                $artistKey => $track[$artistKey],
                $titleKey  => $track[$titleKey],
                $timeKey   => $track[$timeKey],
                $repeatKey => (int)($track[$repeatKey] ?? 1)
            ];
        } else {
            // 重复出现:仅累加 REPEAT
            $merged[$key][$repeatKey] += (int)($track[$repeatKey] ?? 1);
        }
    }

    // 重置数组索引,返回纯数字索引数组
    return array_values($merged);
}

? 使用示例

$music_playlist = [
    ['ID' => 0, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
    ['ID' => 1, 'ARTIST' => 'SOMETHING2', 'TITLE' => 'SOMETHING2', 'TIME' => '02:40', 'REPEAT' => 1],
    ['ID' => 2, 'ARTIST' => 'SOMETHING3', 'TITLE' => 'SOMETHING3', 'TIME' => '03:20', 'REPEAT' => 1],
    ['ID' => 3, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
    ['ID' => 4, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
    ['ID' => 5, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
    ['ID' => 6, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
];

$result = mergeDuplicateTracks($music_playlist);
print_r($result);

输出结果:

Array
(
    [0] => Array
        (
            [ID] => 0
            [ARTIST] => SOMETHING1
            [TITLE] => SOMETHING1
            [TIME] => 04:00
            [REPEAT] => 5
        )
    [1] => Array
        (
            [ID] => 1
            [ARTIST] => SOMETHING2
            [TITLE] => SOMETHING2
            [TIME] => 02:40
            [REPEAT] => 1
        )
    [2] => Array
        (
            [ID] => 2
            [ARTIST] => SOMETHING3
            [TITLE] => SOMETHING3
            [TIME] => 03:20
            [REPEAT] => 1
        )
)

⚠️ 注意事项与最佳实践

  • 字段一致性:确保 $artistKey、$titleKey、$timeKey 在所有数据中存在且类型一致(建议数据库层统一非空约束);
  • 键冲突风险:若 ARTIST 或 TITLE 含 | 字符,建议改用 md5(serialize([$a, $b, $c])) 构建安全哈希键;
  • ID 保留逻辑:本方案保留首次出现的 ID;如需保留最小/最大 ID,可在 if (!isset(...)) 分支中记录并更新;
  • 性能对比:对于千级数据,哈希方案比嵌套 array_filter 快 10–100 倍,且内存可控;
  • 扩展性:函数支持自定义键名(如适配 artist_name / song_title 等不同字段命名风格)。

通过该方法,你不仅能精准完成播放列表去重与计数合并,还能轻松复用于订单汇总、日志聚合、统计报表等同类业务场景。