20. 结构化标记处理工具¶
Python支持各种模块来处理各种形式的结构化数据标记。这包括使用标准通用标记语言(SGML)和超文本标记语言(HTML)的模块,以及使用可扩展标记语言(XML)的几个接口。
- 20.1.
html
- 超文本标记语言支持 - 20.2.
html.parser
- 简单的HTML和XHTML解析器 - 20.3.
html.entities
- HTML一般实体的定义 - 20.4. XML处理模块
- 20.5.
xml.etree.ElementTree
- ElementTree XML API - 20.6.
xml.dom
- 文档对象模型API - 20.7.
xml.dom.minidom
- 最小DOM实现 - 20.8.
xml.dom.pulldom
- 支持构建部分DOM树 - 20.9.
xml.sax
- 支持SAX2解析器 - 20.10.
xml.sax.handler
- SAX处理程序的基类 - 20.11.
xml.sax.saxutils
- SAX实用程序 - 20.12.
xml.sax.xmlreader
- XML解析器接口 - 20.13.
xml.parsers.expat
- 使用Expat快速进行XML解析