带你深入了解XML

互联网 17-4-26

1、XML ： extensible markup language 可扩展标记语言 version="1.0"

可扩展：所有的标签都是自定义的
功能：数据存储

配置文件
数据传输

html 与 xml 区别

HTML语法松散，xml语法严格
html做页面展示，xml做数据存储
Html所有标签都是预定义的，xml所有标签都是自定义的

2、xml语法：

文档声明

version 版本号固定值1.0
encoding 指定文档的码表默认值为iso-8859-1
standalone 指定文档是否独立 yes 或 no
必须写在xml文档的第一行
写法：<?xml version = "1.0"?>
属性

元素 xml文档中的标签

元素名称区分大小写
数字不能开头
文档中必须有且只能有一个根元素
元素需要正确闭合 <body></body> <br/>
元素需要正确嵌套
元素名称要遵守

文本

<!CDATA[数据内容]>
转义字符 &gt；
CDATA 里边的数据会原样显示

属性

属性值必须用引号引起来，单双引号都行

注释

处理指令：现在基本不用

<?xml-stylesheet type="text/css" href="1.css"?>

3、XML约束

约束就是xml的书写规则
约束的分类：

导入xsd约束文档
编写根标签
引入实例名称空间 xmlns:xsi="www.w3.org/2001/XMLSchema-instance"
引入名称空间 xsi:schemaLocation="www.itcast.cn/xml student.xsd"
引入默认的名称空间
student.xsd
student.xml

<?xml version="1.0"?>  <xsd:schema xmlns="www.itheima.cn/xml"          xmlns:xsd="www.w3.org/2001/XMLSchema"          targetNamespace="www.itheima.cn/xml" elementFormDefault="qualified">      <xsd:element name="students" type="studentsType"/>      <xsd:complexType name="studentsType">          <xsd:sequence>              <xsd:element name="student" type="studentType" minOccurs="0" maxOccurs="unbounded"/>          </xsd:sequence>      </xsd:complexType>      <xsd:complexType name="studentType">          <xsd:sequence>              <xsd:element name="name" type="xsd:string"/>              <xsd:element name="age" type="ageType" />              <xsd:element name="sex" type="sexType" />          </xsd:sequence>          <xsd:attribute name="number" type="numberType" use="required"/>      </xsd:complexType>      <xsd:simpleType name="sexType">          <xsd:restriction base="xsd:string">              <xsd:enumeration value="male"/>              <xsd:enumeration value="female"/>          </xsd:restriction>      </xsd:simpleType>      <xsd:simpleType name="ageType">          <xsd:restriction base="xsd:integer">              <xsd:minInclusive value="0"/>              <xsd:maxInclusive value="256"/>          </xsd:restriction>      </xsd:simpleType>      <xsd:simpleType name="numberType">          <xsd:restriction base="xsd:string">              <xsd:pattern value="itheima_\d{4}"/>          </xsd:restriction>      </xsd:simpleType>  </xsd:schema>  <?xml version="1.0" encoding="UTF-8" ?>

<!--
1、编写根标签
2、引入实例名称空间 xmlns:xsi="www.w3.org/2001/XMLSchema-instance"
3、引入名称空间 xsi:schemaLocation="www.itcast.cn/xml student.xsd"
4、引入默认的名称空间
-->

<students      xmlns="www.itheima.cn/xml"      xsi:schemaLocation="www.itheima.cn/xml student.xsd"      xmlns:xsi="www.w3.org/2001/XMLSchema-instance"  >      <student number="itheima_1001">          <name>asfd</name>          <age>12</age>          <sex>male</sex>      </student>  </students>  <students      xmlns:itheima="www.itheima.cn/xml"      xsi:schemaLocation="www.itheima.cn/xml student.xsd"      xmlns:xsi="www.w3.org/2001/XMLSchema-instance"  >      <itheima:student number="itheima_1001">          <itheima:name>asfd</itheima:name>          <itheima:age>12</itheima:age>          <theima:sex>male</itheima:sex>      </itheima:student>  </itheima:students>

内部dtd 在xml内部定义dtd
外部dtd 在外部文件中定义dtd
Student.dtd
student.xml
本地dtd文件 <!DOCTYPE students SYSTEM "student.dtd">
网络dtd文件 <!DOCTYPE students PUBLIC "名称空间" “student.dtd”>

<!ELEMENT students (student*) >  <!ELEMENT student (name,age,sex)>  <!ELEMENT name (#PCDATA)>  <!ELEMENT age (#PCDATA)>  <!ELEMENT sex (#PCDATA)>  <!ATTLIST student number ID #REQUIRED> 唯一的，必须的  <?xml version="1.0" encoding="UTF-8" ?>  <!DOCTYPE students SYSTEM  "student.dtd">  <students>      <student number="s0001" >          <name>zs</name>          <age>abc</age>          <sex>yao</sex>      </student>  </students>

dtd 约束不严谨
schema

4、XML解析

解析XML可以做：

如果xml作为配置文件：读取
如果xml作为传输文件：写、读

XML解析思想：

优点：不占内存，速度快
缺点：只能读取，不能回写
优点：因为在内存中会形成dom树，可以对dom树进行增删改查
缺点：dom树非常占内存，解析速度慢
Document Element Text Attribute Comment
DOM：将文档加载到内存，形成一棵dom树（document对象），将文档的各个组成部分封装为一些对象
SAX：逐行读取，基于事件驱动

xml常用的解析器

定义了一种规则
使用方法
使用步骤
XPath：

public classTestXPath2 {        @Test        publicvoidtest()throwsException{              SAXReaderread= new SAXReader();              Documentdocument= read.read("src/Dom4jTest.xml");              Listnodes= document.selectNodes("/bookstore//book/title");              for(inti= 0;i< nodes.size();i++) {                    Nodenode= (Node)nodes.get(i);                    System.out.println(node.getText());              }        }  }

selectSingleNode()
selectNodes()
注意：要导包 jaxen...jar
创建解析器 SAXReader reader = new SAXReader()
解析xml 获得document对象 Document document = reader.read(url)
// nodename 选取此节点。
// / 从根节点选取。
// // 从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置。
// .. 选取当前节点的父节点。
// @ 选取属性。
// [@属性名] 属性过滤
// [标签名] 子元素过滤
@Test
//遍历所有元素节点

 publicvoidtest2()throwsException{              //创建一个xml解析对象              SAXReaderreader= new SAXReader();              //把xml文档加载到document对象中              Documentdocument= reader.read("src/Book.xml");              Elementroot= document.getRootElement();              treeWalk(root);        }                privatevoidtreeWalk(Elementele){              //输出当前节点的名字              System.out.println(ele.getName());              //ele.nodeCount()得到当前节点的所有子节点的数量              for(inti= 0;i<ele.nodeCount();i++){                    //取出下标为i的节点                    Nodenode= ele.node(i);                    //判断当前节点是否为标签                    if(nodeinstanceofElement){                          //把node强转为标签(Element)                          treeWalk((Element)node);                    }              }        }  }

public classTestDom4j {        @Test        publicvoidtest1()throwsException{              //创建一个xml解析对象              SAXReaderreader= new SAXReader();              //把xml文档加载到document对象中              Documentdocument= reader.read("src/Book.xml");              Elementroot= document.getRootElement();  //          Element bookNode = root.element("书");  //          System.out.println(bookNode.getName());              //得到当前节点所有的子节点              Listlist= root.elements();              //得到第二本书对象              ElementsecondBook= (Element)list.get(1);              //得到当前节点的文本内容              Stringname= secondBook.element("书名").getText();              System.out.println(name);        }