XML入门的常见问题(四)

互联网 16-12-22
  在 xml 对象模型中如何处理空白字符?

  有些时候,XML 对象模型将显示包含空白字符的 TEXT 节点。空白字符被截断后,多半会带来一些混乱。例如下面的 XML 例子:

  ]>  Smith  John

  生成下列树:

  PRocessing Instruction: xml  DocType: person  ELEMENT: person  TEXT:   ELEMENT: lastname  TEXT:   ELEMENT: firstname  TEXT:

  My last name is Smith and my first name is  John

  ELEMENT: person  TEXT: My last name is  ELEMENT: lastname  TEXT: and my first name is  ELEMENT: firstname  TEXT:

  要使只有空白字符的 TEXT 节点消失,请从“person”元素声明中删除 #PCDATA 关键字:

  结果是下面清晰的树:

  Processing Instruction: xml  DocType: person  ELEMENT: person  ELEMENT: lastname  ELEMENT: firstname

  XML 声明做什么?

  XML 声明必须列在 XML 文档的顶部:

  它指定下面的项目:

  该文档是 XML 文档。在丢失或者还没有指定 MIME 类型时 MIME 探测器可以用它来检测文件是否为类型 text/xml。   文档符合 XML 1.0 规范。在以后 XML 有其他版本时这一点很重要。   文档字符编码。编码属性是可选的,默认为 UTF-8。   注意:XML 声明必须在 XML 文档的第一行,因此下面的 XML 文件:

  产生下面的分析错误:

  无效的 xml 声明。  行 0000002:   位置 0000007: ------^  注意:XML 声明是可选的。如果需要在顶部指定注释或者处理指令,那么请不要放入 XML 声明。但是,默认的编码将为 UTF-8。

  如何以可读格式打印我的 XML 文档?

  在用 DOM 从零开始构造文档以产生 XML 文件时,任何内容都在一行上,相互之间没有空格。这是默认的行为。

  构造在 Internet Explorer 5 中的默认 XSL 样式表,以可读格式显示和打印 XML 文档。例如,如果已经安装了 IE5,请尝试查看 nospace.xml 文件。浏览器中应该显示下面的树:

  -   -   XYZ   12.56

  在 XML 中没有插入空白字符。

  打印可读 XML 是非常有趣的,特别是有定义不同类型内容模型的 DTD 时。例如,在混合内容模型 (#PCDATA) 下不能插入空格,因为它可能改变内容的含义。比如请考虑下面的 XML:

  E  lephant  因为单词边界不再正确。

  所有这些都使自动化打印成为问题。如果不需要打印可读 XML,那么可以使用 DOM 在适当的位置插入空白字符作为文本节点。

  如何在 DTD 中使用名称空间? 要在 DTD 中使用名称空间,请在使用它的元素的 ATTLIST 声明中声明它,如下所示:

  名称空间类型必须为 #FIXED。属性的名称空间也是这样:

  如何在 Visual Basic 中使用 XMLDSO?

  使用下面的 XML 作为例子:

  Mark Hanson   206 765 4583     Jane Smith   425 808 1111

  创建新的 VB 6.0 项目。

  添加对 Microsoft ActiveX Data Objects 2.1 或更高版本、Microsoft Data Adapter Library 和 Microsoft XML 2.0 版的引用。

  用下面的代码将 XML 数据加载到 XML DSO 控件中:

  Dim dso As New XMLDSOControl  Dim doc As IXMLDOMDocument  Set doc = dso.XMLDocument  doc.Load ("d:\test.xml")

  用下面的代码将 DSO 映射到使用 DataAdapter 的新记录集对象中:

  Dim da As New DataAdapter  Set da.Object = dso  Dim rs As New ADODB.Recordset  Set rs.DataSource = da

  必须已经安装 MSXML.DLL 的 IE5 版本。在 Visual J++ 6.0 中,从项目菜单选择添加 COM 包装程序,然后从 COM 对象列表中选择“Microsoft XML 1.0”。该操作将把所需的 Java 包装程序构造到称为“msxml”的新软件包中。这些预先构造的 Java 包装程序也可以下载。类可以按如下方法使用:

  import com.ms.com.*;  import msxml.*;  public class Class1  {  public static void main (String[] args)  {  DOMDocument doc = new DOMDocument();  doc.load(new Variant("file://d:/samples/ot.xml"));  System.out.println("Loaded " + doc.getDocumentElement().getNodeName());  }  }

  代码示例将从 sun religion 示例中加载 3.8MB 测试文件“ot.xml”。Variant 类用于包装 Win32 VARIANT 基本类型。

  因为在每次检索节点时实际上都获得了新的包装程序,因此不能在节点上使用指针比较。因此,不要使用下面的代码,

  IXMLDOMNode root1 = doc.getDocumentElement();  IXMLDOMNode root2 = doc.getDocumentElement();  if (root1 == root2)...

  而要使用下面的代码:

  .class 包装程序的总大小大约为 160KB。但是,为了与 W3C 规范完全符合,应该只使用 IXMLDOM* 包装程序。下面的类是旧的 IE 4.0 XML 接口,可以从 msxml 文件夹中删除它们:

  IXMLAttribute*,   IXMLDocument*, XMLDocument*   IXMLElement*,   IXMLError*,   IXMLElementCollection*,   tagXMLEMEM_TYPE*   _xml_error*

  这使大小减少为 147KB。同时还可以删除下面的项目:

  DOMFreeThreadedDocument  在 Java 应用程序中从多个线程访问 XML 文档。   xmlhttpRequest  用 XML DAV HTTP 扩展与服务器通信。   IXTLRuntime  定义 XSL 样式表脚本对象。   XMLDSOControl  绑定到 HTML 页面中的 XML 数据。   XMLDOMDocumentEvents  在分析过程中返回回调。

  这可以将大小减少到 116KB。要使它更小,请考虑 DOM 本身有两层的事实:核心层包括:

  DOMDocument, IXMLDOMDocument   IXMLDOMNode*   IXMLDOMNodeList*   IXMLDOMNamedNodeMap*   IXMLDOMDocumentFragment*   IXMLDOMImplementation   IXMLDOMParseError

  IXMLDOMDocumentType   IXMLDOMEntity   IXMLDOMNotation

  IXMLDOMAttribute   IXMLDOMCDATASection   IXMLDOMCharacterData   IXMLDOMComment   IXMLDOMElement   IXMLDOMProcessingInstruction   IXMLDOMEntityReference   IXMLDOMText

  删除这些将使大小减少到 61KB。但是,对 IXMLDOMElement 来说,getAttribute 和 setAttribute 方法都是有用的。否则需要使用:

以上就是XML入门的常见问题(四)的内容,更多相关内容请关注PHP中文网(www.php.cn)!

来源链接:
免责声明:
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代表本站的观点或立场
标签: xml
上一篇:php获取远程图片并下载保存到本地的方法分析 下一篇:XML入门的常见问题(三)

相关资讯