Python字符串解析：将键值对格式的字符串安全转换为字典

花韻仙語 2026-01-04 00:00:00 次阅读

本文介绍如何将含混合分隔符（`;`、`:`或空格）的变量名-值字符串，稳健地解析为键值对字典，避免动态创建变量带来的安全与可维护性风险。

在Python中处理类似 'var_name; var_value var_name1: var_value1 var_name2 var_value2' 这样的字符串时，目标是提取出变量名（key）与对应值（value），并组织成结构化数据。虽然技术上可通过 exec()、globals() 或 locals() 动态创建同名变量，但强烈不推荐——这会破坏命名空间隔离、引发作用域混乱、增加代码审计难度，并可能造成意外覆盖或注入风险。

✅ 推荐方案：使用字典（dict）作为安全、清晰、可扩展的数据容器。

解析逻辑说明

观察字符串特征：

键与值成对出现，顺序固定（先键后值）；
键可能以 ; 或 : 结尾，也可能无分隔符；
键与值之间以空白字符分隔；
整体以空格为天然切分边界。

因此，最简洁可靠的方式是：

按空白字符（str.split()）分割为标记列表（tokens）；
遍历偶数索引位（0, 2, 4…）作为键，其后一位（i+1）作为值；
对每个键去除末尾的 ; 或 :（用 .rstrip(";:")）；
构建字典。

完整示例代码

string = "var_name; var_value var_name1: var_value1 var_name2 var_value2 var_name3: var_value3"

def parse_kv_pairs(s):
    tokens = s.split()
    if len(tokens) % 2 != 0:
        raise ValueError("Invalid string: unmatched key-value pairs")
    result = {}
    for i in range(0, len(tokens), 2):
        key = tokens[i].rstrip(";:")
        value = tokens[i + 1]
        result[key] = value
    return result

# 使用示例
data = parse_kv_pairs(string)
print(data)
# 输出: {'var_name': 'var_value', 'var_name1': 'var_value1', 'var_name2': 'var_value2', 'var_name3': 'var_value3'}

# 后续可安全访问，如：
print(data["var_name"])  # → 'var_value'

注意事项与增强建议

✅ 健壮性检查：示例中已加入 len(tokens) % 2 校验，防止奇数个token导致索引错误；
⚠️ 类型自动推断（进阶）：若值需转为数字（如 "42" → 42, "3.14" → float），可在赋值前添加类型尝试逻辑（例如用 ast.literal_eval 或自定义转换函数）；
? 支持中文/特殊字符：当前方法兼容UTF-8字符串，只要键值本身不含空格即可正常解析；
? 安全性保障：全程不执行任意代码，杜绝代码注入风险；
? 可扩展性：后续可轻松封装为类、支持从文件读取、添加日志或错误上下文提示。

总之，用字典代替动态变量，是Python数据解析场景下的最佳实践——既简洁、安全，又符合Pythonic哲学。