Python如何遍历XML的同时获取父节点信息

幻夢星雲 2026-01-10 00:00:00 次阅读

最直接可靠的方式是使用lxml库的getparent()方法；标准库xml.etree.ElementTree需手动维护父关系，如递归传参或iterparse栈模拟，不推荐动态打补丁。

在Python中遍历XML并同时获取父节点信息，最直接可靠的方式是使用 lxml 库的 getparent() 方法——标准库 xml.etree.ElementTree 默认不保存父引用，需手动维护或改用 lxml。

用 lxml 一键获取父节点

lxml 的 Element 对象原生支持 .getparent()，无需额外配置：

安装： pip install lxml
解析后任意节点调用 node.getparent() 即可返回其父元素（根节点返回 None）
支持 XPath、迭代、修改等完整功能，性能优于标准库

示例：

from lxml import etree

xml_str = "text"
root = etree.fromstring(xml_str)

for elem in root.iter():
    parent = elem.getparent()
    print(f"标签: {elem.tag}, 父标签: {parent.tag if parent is not None else 'None'}")

用 xml.etree.ElementTree 手动构建父关系

如果必须用标准库，可通过递归遍历时显式传递父节点：

不依赖外部包，适合轻量或受限环境
遍历时把当前节点作为参数传给子节点处理函数
避免后期反复查找父节点，逻辑清晰可控

示例：

import xml.etree.ElementTree as ET

def walk_with_parent(elem, parent=None):
    print(f"当前: {elem.tag}, 父节点: {parent.tag if parent is not None else 'None'}")
    for child in elem:
        walk_with_parent(child, elem)

root = ET.fromstring("")
walk_with_parent(root)

用 iterparse 遍历时缓存父栈（适合大文件）

处理超大 XML 时，iterparse 可边解析边处理，用栈模拟父子层级：

遇到 start 事件时将当前元素压栈，此时栈顶下一个是其父节点

遇到 end 事件时弹出，保持栈与实际嵌套深度一致

内存友好，适合 GB 级 XML 流式处理

示例关键逻辑：

stack = [] for event, elem in ET.iterparse("file.xml", events=("start", "end")): if event == "start": if stack: parent = stack[-1] print(f"{elem.tag} 的父节点是 {parent.tag}") stack.append(elem) elif event == "end": stack.pop()

不推荐：给 ElementTree 打补丁加 parent 属性

有人尝试通过 elem.parent = parent 动态赋值来“修复”标准库，但存在风险：

新创建的子元素（如用 SubElement）不会自动设 parent

复制、深拷贝、XPath 查找结果等场景 parent 关系易丢失

代码可维护性差，容易引发隐性 bug

除非有强约束不能引入第三方库，否则优先选 lxml 或递归传参方式。

相关栏目：【最新资讯】【网络优化】【主机评测】【网站百科】【技术教程】【文学范文】【分站】【网址导航】【关于我们】

python app 栈 node 标准库 elif

上一篇文章

MySQL 中实现两表比对并标记匹配状态的完整教程

2026-01-10 962次阅读

下一篇文章

c# Orleans 框架是什么 c#虚拟Actor模型和A

2026-01-10 495次阅读

相关文章

技术教程

Python文本编码与解码_跨平台解析说

2026-01-01 1291次阅读

技术教程

Django ORM 中处理并发更新的正

2025-12-31 1317次阅读

技术教程

如何在 Python 中递归展平嵌套的字

2025-12-31 1937次阅读

技术教程

c++怎么调用nana库开发GUI_c+

2026-01-01 1568次阅读

技术教程

Flask 表单数据提交后如何正确调用邮

2026-01-01 114次阅读

技术教程

C++如何使用std::transfor

2026-01-01 337次阅读

热门文章

技术教程

如何使用Golang管理模块版本_Gol

2026-01-01 1733次阅读

技术教程

如何在Golang中使用http.Cli

2026-01-01 914次阅读

技术教程

如何在 Go 中优雅地映射具有动态字段的

2025-12-31 257次阅读

技术教程

如何使用Golang math/big处

2026-01-01 69次阅读

技术教程

如何为不同团队 ID 动态生成多个“值班

2025-12-31 1135次阅读

技术教程

Laravel 数据库重播种：安全添加新

2025-12-31 1620次阅读

推荐阅读

技术教程

VSC里PHP变量未定义报错怎么解决_错

2026-01-01 952次阅读

技术教程

如何使用Golang设置环境变量_Gol

2025-12-31 1838次阅读

技术教程

跨文件调用类方法怎么用_php作用域操作

2026-01-01 672次阅读

技术教程

如何在 Go 后端安全获取并验证前端存储

2026-01-01 779次阅读

技术教程

php下载安装包怎么选_threadsa

2026-01-01 1852次阅读

技术教程

php怎么下载安装后开启短标签_phpi

2025-12-31 292次阅读

标签云

Javadoc Mav getArea newHttpClient updateBalance HttpGet bintray 主类 customerId 务请 Vie getSomething ActiveRecord getInputStream FileOutputStream LoopingInput softRef SoftReference parts QName VARIABLE_VALUE MyRunnable myStringArray 泛化 OutOfMemoryError IOEx OpenCSV CSVReader authenticationManager PostMapping

- 广而告之 -