我不能得到xml.etree.ElementTree打印或确认正确的XHTML标题。它坚持提供一个通用的XML头,在所有标记前面加上“html:”,抛出异常,或者这些异常的组合。在
如何首先创建一个有效的XHTML文档?在
我有大约4兆字节的xml文件,我正试图从中创建一个有效的epub。有各种各样的munging需要完成,例如,标记在xhtml中没有位置。在
以下代码:import xml.etree.ElementTree as ET
xhtml = ET.fromstring(
"<?xml version=\"1.0\" xmlns=\"http://www.w3.org/1999/xhtml\" ?>\n
\n\n")投掷:xml.etree.ElementTree.ParseError: XML declaration not well-formed: line 1, column 31
如果我改为给出“正确的”xhtml头,它会坚持它是html,给出自己的xml头,并在所有标记前面加上“html:”
如果我给出了“正确”的xml头,那么epubcheck会抱怨“”不是有效的命名空间(我想它不是)。在
其原理是,如果我可以创建(并随后写出)一个有效的xhtml文档,那么我就可以解析我的xml以找到所需的
和{},适当地修改它们(例如,href和src的all needed changed),将它们粘在那里,然后变成黄金。在根据我的发现,一个有效的xhtml文档必须以