DTD中的NOTATION是什么 用于声明非XML数据类型

NOTATION 是 DTD 中声明外部非 XML 数据类型的机制,仅提供标识名及可选 public/system ID,供属性引用以告知解析器跳过解析、交由外部处理器处理,不包含数据本身也不验证格式。

NOTATION 是 DTD(文档类型定义)中用于声明外部非 XML 数据类型的机制,它本身不定义数据内容,而是为外部数据(如图片、音频、PDF 等)提供一个可被元素或属性引用的“标识名”和关联的处理信息。

NOTATION 的作用:标记外部数据类型

XML 解析器默认只处理 XML 格式文本。当文档中需要引用二进制或非 XML 格式的数据(例如 logo.pngreport.pdfaudio.wav)时,NOTATION 就用来告诉解析器:“这是一个特殊类型的数据,别按 XML 解析,交给外部应用或处理器去处理”。

它不包含数据本身,也不验证数据格式,只是注册一个名字 + 可选的公共标识符(public ID)和系统标识符(system ID),供后续在元素或属性声明中引用。

语法格式

基本声明形式如下:

name PUBLIC "public-id" "system-id">

或仅用系统标识符:

name SYSTEM "system-id">

例如:


如何在元素或属性中使用 NOTATION

NOTATION 必须配合 NOTATION 类型的属性来使用,常见于声明能携带外部资源的元素:

  • 声明一个属性,其值必须是已声明的 NOTATION 名
  • 该属性通常与空元素或包含元数据的元素搭配,比如:

示例 DTD 片段:

svg SYSTEM "image/svg+xml">

  type NOTATION (svg | png | pdf) #REQUIRED
  src CDATA #REQUIRED>

这样, 就合法了——解析器知道 type 的取值只能是已声明的 NOTATION 名,且语义上表示“这是 SVG 类型的外部资源”。

注意事项

  • NOTATION 不触发自动加载或解析外部数据;它只是元数据,实际处理由应用程序决定
  • 公共标识符(PUBLIC)用于标准化命名(如 ISO 标准),系统标识符(SYSTEM)通常是 MIME 类型或 URL,但无强制校验
  • XML Schema 中没有直接等价物;类似功能需靠 xsi:type 或自定义 schema 注解模拟,但语义更弱
  • 现代 Web 应用中较少直接用 DTD NOTATION,更多靠 MIME 类型 + HTTP 头或前端 JS 自行识别,但在遗留出版系统、DocBook 或某些嵌入式 XML 场景中仍有实际用途

基本上就这些。NOTATION 是 DTD 中一个轻量但关键的“类型挂钩”,让 XML 文档能安全、可声明地关联外部非 XML 内容。