答案是使用窗口函数计算连续登录天数。通过ROW_NUMBER()为每个用户登录日期排序,用DATE_SUB生成date_diff,相同date_diff代表连续登录,再按user_id和date_diff分组统计最大连续天数。
直接说吧,用SQL计算连续登录次数,关键在于找到每个用户的登录日期序列,然后找出这些序列中连续的部分。这听起来有点绕,但实际上分解开来,思路就很清晰了。
解决方案
SQL实现连续登录次数的统计,核心在于如何识别连续的日期。以下提供一种基于窗口函数的解决方案,并逐步解释其原理。
WITH UserLogins AS (
SELECT
user_id,
login_date,
ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY login_date) as rn
FROM
login_table
),
ContinuousLogin AS (
SELECT
user_id,
login_date,
DATE_SUB(login_date, INTERVAL rn DAY) as date_diff
FROM
UserLogins
),
GroupedContinuousLogin AS (
SELECT
user_id,
date_diff,
COUNT(*) AS continuous_days
FROM
ContinuousLogin
GROUP BY
user_id,
date_diff
)
SELECT
user_id,
MAX(continuous_days) AS max_continuous_days
FROM
GroupedContinuousLogin
GROUP BY
user_id;这段代码分成了几个部分,我们来逐步拆解:
UserLogins CTE: 这一步主要是为了给每个用户的登录日期进行编号。
ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY login_date)
会为每个用户按照登录日期排序,生成一个序号rn
。这个序号是后续计算连续登录的关键。ContinuousLogin CTE: 这一步的核心在于
DATE_SUB(login_date, INTERVAL rn DAY)
。 它将登录日期减去对应的序号rn
。如果登录日期是连续的,那么date_diff
的值就会相同。 举个例子,如果用户在 2025-10-26, 2025-10-27, 2025-10-28 登录,那么对应的rn
分别是 1, 2, 3。date_diff
的值
都会是 2025-10-25。GroupedContinuousLogin CTE: 这一步将
ContinuousLogin
的结果按照user_id
和date_diff
进行分组,并计算每个组内的登录天数COUNT(*)
。 这样就得到了每个用户的每个连续登录段的长度。最终SELECT语句: 最后,我们只需要对
GroupedContinuousLogin
的结果按照user_id
分组,并取continuous_days
的最大值MAX(continuous_days)
,就可以得到每个用户的最大连续登录天数。
如何处理登录日期不连续的情况?
如果用户登录日期不连续,
date_diff的值就会不同,从而被分到不同的组里。 例如,用户在 2025-10-26, 2025-10-27, 2025-10-29 登录,那么
date_diff的值分别是 2025-10-25, 2025-10-25, 2025-10-26。 这样,2025-10-26 和 2025-10-27 会被分到同一个组,而 2025-10-29 会被分到另一个组。
如何优化SQL查询性能?
优化SQL查询性能,可以考虑以下几个方面:
-
索引: 确保
login_table
表的user_id
和login_date
列上有索引。 这可以显著提高查询速度,尤其是在数据量大的情况下。 -
数据类型: 确保
login_date
列的数据类型是DATE
或DATETIME
。 这可以避免在计算日期差时进行类型转换,提高查询效率。 -
避免全表扫描: 尽量避免在
WHERE
子句中使用函数或表达式,这会导致全表扫描。 - 查询计划: 使用数据库的查询计划工具来分析查询的执行计划,并根据分析结果进行优化。
除了窗口函数,还有其他方法吗?
当然,除了窗口函数,还有其他方法可以实现连续登录次数的统计。 例如,可以使用游标或循环来实现。 但是,这些方法的性能通常不如窗口函数。 窗口函数是SQL标准提供的功能,经过数据库引擎的优化,通常能够提供更高的性能。 另外,不同的数据库系统可能提供特定的函数或语法来简化连续登录次数的统计。 例如,某些数据库系统可能提供
LAG()或
LEAD()函数,可以更方便地访问前一行或后一行的数据。

都会是 2025-10-25。






