python判断文件内容是否为空

判断文件是否为空有三种方法:一是读取全部内容并strip后判断,准确但内存占用高;二是用os.path.getsize检查零字节,最快但无法识别纯空白;三是先查大小再读样本判断,兼顾效率与准确性。

判断文件内容是否为空,最直接的方法是读取文件并检查其内容是否为空字符串或仅含空白字符。

检查文件是否为空(不含空白字符)

打开文件,读取全部内容,再用 strip() 去掉首尾空白后判断是否为空:

def is_file_empty(filepath):
    try:
        with open(filepath, 'r', encoding='utf-8') as f:
            return not f.read().strip()
    except (FileNotFoundError, PermissionError):
        return None  # 文件不存在或无权限,可按需处理

✅ 优点:能正确识别只含空格、换行、制表符等“视觉上为空”的文件。
❌ 注意:对超大文件会一次性读入内存,不推荐用于 GB 级文件。

检查文件是否为零字节(最快方式)

如果只需判断物理大小是否为 0 字节,用 os.path.getsize 效率最高:

import os

def is_file_zero_size(filepath): try: return os.path.getsize(filepath) == 0 except (FileNotFoundError, OSError): return None

✅ 优点:不读文件内容,秒级返回,适合批量快速筛查。
⚠️ 注意:它无法识别“非空文件但内容全是空格/换行”的情况。

兼顾效率与语义的稳妥做法

先查大小,为 0 则直接判空;非 0 再读少量内容(如前 1024 字节)判断是否有有效字符:

def is_file_truly_empty(filepath, sample_size=1024):
    try:
        if os.path.getsize(filepath) == 0:
            return True
        with open(filepath, 'r', encoding='utf-8') as f:
            sample = f.read(sample_size)
            return not sample.strip()
    except (FileNotFoundError, PermissionError, UnicodeDecodeError):
        return None

✔️ 平衡了速度和准确性,适合大多数实际场景。
✔️ 避免大文件全量读取,也避免误判纯空白文件。

基本上就这些。选哪种方式,取决于你更在意“物理空”还是“逻辑空”,以及文件可能的大小范围。