PHP DOMDocument怎么用 DOMDocument类生成和解析XML方法

DOMDocument 是 PHP 处理 XML/HTML 最标准可靠的方式,支持安全生成、解析、验证;需指定编码、启用 formatOutput、禁用外部实体,并注意节点存在性校验。

PHP 的 DOMDocument 类是处理 XML(也支持 HTML)最标准、最可靠的内置方式之一。它基于 W3C DOM 标准,能安全地生成、修改、读取和验证 XML 文档,避免字符串拼接带来的格式错误或转义问题。

用 DOMDocument 生成 XML

创建 XML 文档时,推荐从空文档开始,逐层构建节点,确保结构合法、字符自动转义。

  • 先实例化 DOMDocument,可指定版本和编码(如 '1.0', 'UTF-8'
  • createElement() 创建元素节点,createTextNode() 创建文本内容
  • appendChild()insertBefore() 组织层级关系
  • 调用 saveXML()

    获取字符串,或 save('file.xml') 直接写入文件

示例:生成一个带属性和子节点的简单配置 XML

$doc = new DOMDocument('1.0', 'UTF-8');
$doc->formatOutput = true; // 自动缩进,便于阅读

// 创建根节点
$root = $doc->createElement('config');
$doc->appendChild($root);

// 创建子节点 & 设置文本
$app = $doc->createElement('app');
$app->appendChild($doc->createTextNode('MyApp'));
$root->appendChild($app);

// 创建带属性的节点
$env = $doc->createElement('environment');
$env->setAttribute('mode', 'production');
$env->appendChild($doc->createTextNode('staging'));
$root->appendChild($env);

echo $doc->saveXML(); // 输出格式化后的 XML 字符串

用 DOMDocument 解析已有 XML

加载 XML 字符串或文件后,通过 DOM 方法遍历、查询、提取数据。注意开启错误报告并抑制警告(如非法字符),再用 libxml_use_internal_errors(true) 避免解析失败中断脚本。

  • loadXML($string) 加载字符串,load('file.xml') 加载文件
  • getElementsByTagName() 按标签名快速获取节点列表
  • getAttribute() 读取属性值,nodeValuetextContent 获取文本内容
  • 支持 XPath 查询(需配合 DOMXPath 类),适合复杂路径匹配

示例:解析上面生成的 XML 并读取 environment 的 mode 属性

libxml_use_internal_errors(true); // 忽略警告
$doc = new DOMDocument();
$doc->loadXML($xmlString); // 或 load('config.xml')

$envNodes = $doc->getElementsByTagName('environment');
if ($envNodes->length > 0) {
    $env = $envNodes->item(0);
    echo $env->getAttribute('mode'); // 输出:production
    echo $env->textContent;          // 输出:staging
}

常见注意事项和技巧

DOMDocument 看似简单,但几个细节不注意容易踩坑:

  • 中文等非 ASCII 字符必须声明编码(构造时传 'UTF-8'),否则保存后可能乱码
  • 默认不自动缩进,设 $doc->formatOutput = true 后才启用美化输出
  • 解析含 DTD 或外部实体的 XML 有安全隐患,建议禁用: libxml_disable_entity_loader(true)(PHP 8.0+ 已默认禁用)
  • 节点操作前务必确认对象存在(如 $node->item(0) 可能为 null),避免报错
  • 大量节点操作时,可先用 importNode() 复制外部文档节点,避免跨文档异常

基本上就这些。DOMDocument 不复杂但容易忽略编码和错误处理,按规范初始化、查文档、加判断,就能稳稳搞定 XML 生成与解析。