您现在的位置是:主页 > news > 淘宝网站建设 深圳/seo国外英文论坛
淘宝网站建设 深圳/seo国外英文论坛
admin2025/4/30 1:53:29【news】
简介淘宝网站建设 深圳,seo国外英文论坛,如何做电子书网站,可以做图的网站XML:可扩展标记型语言随着json等一些技术的普及,似乎xml的路子越来越窄,虽然xml的一些功能被其他的一些技术代替,但是学习xml还是非常有必要,如果用xml存储一些大量数据,还是有一定优势的,就算你…

XML:可扩展标记型语言
随着json等一些技术的普及,似乎xml的路子越来越窄,虽然xml的一些功能被其他的一些技术代替,但是学习xml还是非常有必要,如果用xml存储一些大量数据,还是有一定优势的,就算你不管这些,但是现有的很多框架以及技术的配置文件都存在于xml中,最起码你得对它的结构以及一些基本用法有一定了解
(一) 基本概述
(1) 概念
XML:Extensible Markup Language:可扩展标记型语言
标记型:使用标签来操作,html就是一种常见的标记型语言
可扩展:可以自定义标签,甚至可以用中文写标签 Eg:<person></person
<张三><张三>
(2) 用途
xml 主要用来存储数据,体现在作配置文件,或者充当小型数据库,在网络中传输数据
A:配置文件:例如配置mysql数据库
前面我们常常书写 一个 jdbc.properties文件来做配置文件,好处呢就是如果想修改数据库的信息,不需要修改源代码,只要修改配置文件就可以了,而xml也可以作为配置文件来使用
url=jdbc:mysql://localhost:3306/db1user=rootpassword=root99driver=com.mysql.jdbc.Driver<!--例如模拟配置mysql数据库 只为假设,与前面知识对应,实际配置文件后期会很常见--><?xml version="1.0" encoding="UTF-8"?><config><dbinfo><dbDriver>com.mysql.jdbc.Driver</dbDriver><dbUrl>jdbc:mysql://localhost:3306/db1</dbUrl><username>root</username><password>root99</password></config>
B:充当小型数据库
我们可以在xml中存储一些数据,让它充当一个小型的数据库
<?xml version="1.0" encoding="UTF-8"?><student> <stu> <id>001</id> <name>zhangsan</name> <age>20</age> </stu> <stu> <id>002</id> <name>lisi</name> <age>30</age> </stu> </student>
C:传输数据
在网络编程中,我们或多或少接触过,例如如何实现一个简单的聊天室,基本原理是这样的,一个服务器端,多个客户端,当客户端1发送数据后,服务器端接收到数据,并且对数据进行一定的审核(是否有非法敏感字)以及格式的处理,再将数据发送到每一个客户端中
刚开始的时候,我们一般选择使用字符串直接传递内容,但是却不是很利于程序的后期维护,而使用xml就能对后期程序的维护更加友好
<?xml version="1.0" encoding="UTF-8"?><message id="1"><sender>账号1</sender><getter>账号2</getter><content>发送的信息</content><ip>ip地址</ip></message>
(二) xml语法
xml文档的后缀名为 .xml
(1) 文档声明
创建一个xm文件后,第一步就是 必须要有 一个文档声明(写了文档声明之后,表写xml文件的内容)
<?xml version="1.0" encoding="UTF-8"?>
- version : xml版本,必须写
- encoding:xml编码 常见编码: GBK、UTF-8、ISO8859-1(不包含中文)
- 保存时编码和设置打开时候的编码需要一致,否则会出现乱码
- standalone:是否需要依赖其他文件 yes/no
(2) 标签的定义
注意事项:
- 有始有终:
<person></peoson>
- 合理嵌套:
<aa><bb></bb></aa>
- 空格和换行均当做内容来解析,所以可能我们需要注意一些缩进的问题
名称规则:
- xml 代码区分大小写
- 名称不能以数字或者标点符号开始
- 不能以 xml、XML、Xml等开头
- 不能包含空格和冒号
(3) 属性的定义
- 一个标签上可有多个属性
<person id1="aaa" id2="bbb"></person>
- 属性名称和值之间使用 = 连接,属性值用引号包起来(单引号和双引号都可以)
(4) 注释
<?xml version="1.0" encoding="UTF-8"?><!-- xml注释 -->
注释不能嵌套,并且不能放到第一行,第一行必须方式文档声明
(5) 特殊字符
如果想在xml中输入特殊字符,需要对字符进行转义,因为 < 等会被当做标签
字符转义字符描述&&和<<小于号>>大于号""双引号''单引号
若多个字符都需要转义,则可以将这些内容存放到CDATA里面
<![CDATA[ 内容 ]]>
(七) PI指令 (处理指令)
可以在xml设置样式
<?xml-stylesheet type="text/css" href="css的路径"?>
(三) xml约束
为什么需要用到约束呢?比如我们现在定义一个 student.xml文件,我们想要在其中保存关于学生的信息,例如id,name,age,但是如果随便写入一个标签 例如 <你好> 从语法的角度上虽然是符合规范的,但是这显然与我们想要存储的东西没有任何关系,所以我们需要通过xml约束技术,约束xml中只能出现的元素
分类:
- DTD:一种相对简单的约束技术
- Schema:一种相对复杂的约束技术,看懂即可
DTD约束
(1) dtd的引入方式(三种)
A:使用内部的dtd文件,即将约束规则定义在xml文档中
<!DOCTYPE 根元素名称 [<!ELEMENT person (name,age)><!ELEMENT name (#PCDATA)><!ELEMENT age (#PCDATA)>]>
B:引入外部的dtd文件
<!DOCTYPE 根元素名称 SYSTEM "dtd路径">
C:使用外部的dtd文件(网络上的dtd文件)
<!DOCTYPE 根元素 PUBLIC "DTD名称" "DTD文档的URL">例如使用 struts2框架 使用配置文件 所使用 外部的dtd文件<!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTDStruts Configuration 2.0//EN" "http://struts.apache.org/dtds/struts-2.0.dtd">
(2) 使用dtd定义元素
<!ELEMENT 元素名 约束>
A:简单元素(没有子元素)
ELEMENT name (#PCDATA)>(#PCDATA): 约束name是字符串类型EMPTY : 元素为空(没有内容)- <sex></sex>ANY:任意
B:复杂元素
<!-- 语法 --><!ELEMENT person (id,name,age,)>子元素只能出现一次<!ELEMENT 元素名称 (子元素)><!-- 子元素出现次数 -->* :一次多或多次?:零次或一次* :零次或多次<!-- 子元素直接使用逗号隔开 -->表示元素出现的顺序 <!-- 子元素直接使用 | -->表示元素只能出现其中的任意一个
(2) 使用dtd定义属性
<!-- 语法 --><!ATTLIST 元素名称属性名称 属性类型 属性的约束><!-- 属性类型 --> CDATA: 字符串<!ATTLIST birthdayID1 CDATA #REQUIRED><!-- 枚举 -->表示只能在一定的范围内出现值,但是只能每次出现其中的一个,红绿灯效果<!ATTLIST ageID2 (AA|BB|CC) #REQUIRED><!-- ID: 值只能是字母或者下划线开头 --><!ATTLIST name ID3 ID #REQUIRED><!-- 属性的约束 -->#REQUIRED:属性必须存在#IMPLIED:属性可有可无#FIXED: 表示一个固定值 #FIXED "AAA"属性的值必须是设置的这个固定值<!ATTLIST sexID4 CDATA #FIXED "ABC">直接值不写属性,使用直接值写了属性,使用设置那个值<!ATTLIST schoolID5 CDATA "WWW">
Schema约束
schema 符合 xml 的语法,一个 xml 中可以有多个 schema ,多个 schema 使用名称空间区分(类似于java包名)dtd 里面有PCDATA类型,但是在 schema 里面可以支持更多的数据类型
后缀名:xsd
引入:填写xml文档的根元素引入xsi前缀. xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"表示xml文件是一个约束文件引入xsd文件命名空间. xsi:schemaLocation="http://www.bwh.cn/xml student.xsd"使用一个使用schema约束文件,直接通过这个地址引入约束文件通常使用一个url地址防止重名为每一个xsd约束声明一个前缀,作为标识 xmlns="http://www.bwh.cn/xml"
(1) 看xml中有多少个元素
<element>
(2) 看简单元素和复杂元素
<element name="person"><complexType><sequence><element name="name" type="string"></element><element name="age" type="int"></element></sequence></complexType></element>
(3) 被约束文件里面引入约束文件
<person xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xmlns="http://www.bwh.cn/20151111"xsi:schemaLocation="http://www.bwh.cn/20151111 1.xsd">xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"-- 表示xml是一个被约束文件xmlns="http://www.bwh.cn/20151111"-- 是约束文档里面 targetNamespacexsi:schemaLocation="http://www.bwh.cn/20151111 1.xsd">-- targetNamespace 空格 约束文档的地址路径
可以约束属性
A: <sequence>:表示元素的出现的顺序B: <all>: 元素只能出现一次C: <choice>:元素只能出现其中的一个D: maxOccurs="unbounded": 表示元素的出现的次数E: <any></any>:表示任意元素写在复杂元素里面写在 </complexType>之前--<attribute name="id1" type="int" use="required"></attribute>- name: 属性名称- type:属性类型 int stirng- use:属性是否必须出现 required
(四) xml的解析
很简单的理解解析:有一个xml,在其中读取出需要的数据
(1) 解析方式 dom和sax
DOM:根据xml的层级结构在内存中分配一个树形结构,把xml的标签,属性和文本都封装成对象,一次性加载进内存
- 优点:操作方便,很容易实现增删改操作
- 缺点:占内存,有造成内存溢出风险
SAX:采用事件驱动,边读边解析,解析到某一个对象,返回对象名称
- 优点:不占内存
- 缺点:只能读取,不能实现增删改操作
(2) 解析器
想要解析xml,我们必须了解解析器,不同的公司和组织,提供了针对dom和sax方式的解析器,通过api方式提供 (今天着重讲解两种比较常用的)
- jaxp:sun公司所提供针对dom和sax的解析器,效率略低
- dim4j:非常优秀的解析器,在实际开发中比较常用
- jdom:jdom组织所提供的针对dom和sax解析器
- jsoup:jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
- Pull:Android操作系统内置的解析器,sax方式的
(3) 使用 dom4 操作 xml
注意:下面的所有java代码中,由于我的代码写在Module中,所以路径加了名字,若直接创建的是项目,只写src/s1.xml即可
<?xml version="1.0" encoding="UTF-8"?><student><stu id1="love"><name>zhangsan</name><age>20</age></stu><stu><name>lisi</name><age>30</age></stu></student>
※ 使用dom4j实现查询xml操作
(一)查询所有name元素里面的值
package cn.ideal.xml.dom4j;/*1、创建解析器2、得到document3、得到根节点 getRootElement() 返回Element4、得到所有的p1标签* elements("p1") 返回list集合* 遍历list得到每一个p15、得到name* 在p1下面执行 element("name")方法 返回Element6、得到name里面的值* getText方法得到值*/import org.dom4j.Document;import org.dom4j.DocumentException;import org.dom4j.Element;import org.dom4j.io.SAXReader;import java.util.List;public class TestDom4j1 {//查询xml中所有name元素的值public static void main(String[] args) throws DocumentException {//创建解析器SAXReader saxReader = new SAXReader();//得到documentDocument document = saxReader.read("code-04_xml/src/s1.xml");//得到根节点Element rootElement = document.getRootElement();//得到stuList<Element> list = rootElement.elements("stu");//遍历listfor (Element element : list) {//element是每一个元素//得到name里面的值Element name1 = element.element("name");//得到name里面的值String s = name1.getText();System.out.println(s);}}}//运行结果zhangsanlisi
(二)查询第一个name元素的值
package cn.ideal.xml.dom4j;/*1、创建解析器2、得到document3、得到根节点4、得到第一个stu元素element("stu")方法 返回Element5、得到p1下面的name元素element("name")方法 返回Element6、得到name元素里面的值getText方法*/import org.dom4j.Document;import org.dom4j.DocumentException;import org.dom4j.Element;import org.dom4j.io.SAXReader;public class TestDom4j2 {public static void main(String[] args) throws DocumentException {//创建解析器SAXReader saxReader = new SAXReader();//得到document对象Document document = saxReader.read("code-04_xml/src/s1.xml");//得到根节点Element rootElement = document.getRootElement();//得到第一个stu元素Element stu = rootElement.element("stu");//得到stu下面的name元素Element name1 = stu.element("name");//得到name的值String s1 = name1.getText();System.out.println(s1);}}//运行结果zhangsan
(三)获取第二个name元素的值
package cn.ideal.xml.dom4j;import org.dom4j.Document;import org.dom4j.DocumentException;import org.dom4j.Element;import org.dom4j.io.SAXReader;import java.util.List;/*1、创建解析器2、得到document3、得到根节点4、得到所有的stu返回 list集合5、遍历得到第二个stu使用list下标得到 get方法,集合的下标从 0 开始,想要得到第二个值,下标写 16、得到第二个p1下面的nameelement("name")方法 返回Element7、得到name的值getText方法*/public class TestDom4j3 {public static void main(String[] args) throws DocumentException {//创建解析器SAXReader saxReader = new SAXReader();//得到documentDocument document = saxReader.read("code-04_xml/src/s1.xml");//得到根节点Element rootElement = document.getRootElement();//得到所有stuList<Element> list = rootElement.elements("stu");//得到第二个stuElement stu2 = list.get(1);//得到stu下的nameElement name2 = stu2.element("name");//得到name里面的值String s2 = name2.getText();System.out.println(s2);}}
※ 使用dom4j实现添加操作
(一)在第一个p1标签末尾添加一个元素 <sex>male</sex>
package cn.ideal.xml.dom4j;import org.dom4j.Document;import org.dom4j.Element;import org.dom4j.io.OutputFormat;import org.dom4j.io.SAXReader;import org.dom4j.io.XMLWriter;import java.io.FileOutputStream;/*1、创建解析器2、得到document3、得到根节点4、获取到第一个p1使用element方法5、在p1下面添加元素在p1上面直接使用 addElement("标签名称")方法 返回一个Element6、在添加完成之后的元素下面添加文本在sex上直接使用 setText("文本内容")方法7、回写xml格式化 OutputFormat,使用 createPrettyPrint方法,表示一个漂亮的格式使用类XMLWriter 直接new 这个类 ,传递两个参数第一个参数是xml文件路径 new FileOutputStream("路径")第二个参数是格式化类的值*/public class TestDom4j4 {public static void main(String[] args) throws Exception {//创建解析器SAXReader saxReader = new SAXReader();//得到documentDocument document = saxReader.read("code-04_xml/src/s1.xml");//得到根节点Element rootElement = document.getRootElement();//得到第一个stu元素Element stu = rootElement.element("stu");//在stu下面直接添加元素Element sex1 = stu.addElement("sex");//在sex下面添加文本sex1.setText("male");//回写xmlOutputFormat prettyPrint = OutputFormat.createPrettyPrint();//有缩进效果XMLWriter xmlWriter = new XMLWriter(new FileOutputStream("code-04_xml/src/s1.xml"), prettyPrint);xmlWriter.write(document);}}
写一个工具类,简化操作
封装方法的操作,可以省略创建解析器 得到document 以及回写xml的方法,把传递的文件路径,封装成一个常量
好处:可以提高开发速度,可以提交代码可维护性
比如想要修改文件路径(名称),这个时候只需要修改常量的值就可以了,其他代码不需要做任何改变
package cn.ideal.xml.utils;import org.dom4j.Document;import org.dom4j.DocumentException;import org.dom4j.io.OutputFormat;import org.dom4j.io.SAXReader;import org.dom4j.io.XMLWriter;import java.io.FileOutputStream;import java.io.IOException;public class Dom4jUtils {public static final String PATH = "code-04_xml/src/s1.xml";//返回documentpublic static Document getDocument(String path) {//创建解析器SAXReader saxReader = new SAXReader();//得到documenttry {Document document = saxReader.read(path);return document;} catch (DocumentException e) {e.printStackTrace();}return null;}//回写xml的方法public static void xmlWriters(String path, Document document) {try {OutputFormat prettyPrint = OutputFormat.createPrettyPrint();//有缩进效果XMLWriter xmlWriter = new XMLWriter(new FileOutputStream(path), prettyPrint);xmlWriter.write(document);} catch (IOException e) {e.printStackTrace();}}}
我们上面执行添加操作的代码就可以简化为
package cn.ideal.xml.dom4j;import cn.ideal.xml.utils.Dom4jUtils;import org.dom4j.Document;import org.dom4j.Element;public class TestDom4j5 {public static void main(String[] args) throws Exception {Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);//得到根节点Element rootElement = document.getRootElement();//得到第一个stu元素Element stu = rootElement.element("stu");//在stu下面直接添加元素Element sex1 = stu.addElement("sex");//在sex下面添加文本sex1.setText("male");//回写xmlDom4jUtils.xmlWriters(Dom4jUtils.PATH, document);}}
(二)使用dom4j实现在特定位置添加元素
在第一个stu下面的name标签前添加 <id>001</id>
package cn.ideal.xml.dom4j;import cn.ideal.xml.utils.Dom4jUtils;import org.dom4j.Document;import org.dom4j.DocumentHelper;import org.dom4j.Element;import java.util.List;/*1、创建解析器2、得到document3、得到根节点4、获取到第一个p15、获取p1下面的所有的元素** elements()方法 返回 list集合** 使用list里面的方法,在特定位置添加元素** 首先创建元素 在元素下面创建文本- 使用DocumentHelper类方法createElement创建标签- 把文本添加到标签下面 使用 setText("文本内容")方法** list集合里面的 add(int index, E element)- 第一个参数是 位置 下标,从0开始- 第二个参数是 要添加的元素6、回写xml*/public class TestDom4j6 {//在第一个stu下面的name标签前添加<id>001</id>public static void main(String[] args) {Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);//得到根节点Element rootElement = document.getRootElement();//得到第一个stu元素Element stu = rootElement.element("stu");//获取stu下全部元素List<Element> list = stu.elements();//创建元素Element id = DocumentHelper.createElement("id");//在id下面创建文本id.setText("001");//在特定位置添加list.add(0, id);Dom4jUtils.xmlWriters(Dom4jUtils.PATH, document);}}
(三)使用dom4j实现修改节点的操作
修改第一个p1下面的age元素的值为18
package cn.ideal.xml.dom4j;/*1、得到document2、得到根节点,然后再得到第一个p1元素3、得到第一个p1下面的ageelement("")方法4、修改值是 30使用setText("文本内容")方法5、回写xml*/import cn.ideal.xml.utils.Dom4jUtils;import org.dom4j.Document;import org.dom4j.Element;public class TestDom4j7 {public static void main(String[] args) {//得到documentDocument document = Dom4jUtils.getDocument(Dom4jUtils.PATH);//得到根节点Element rootElement = document.getRootElement();//得到第一个stu元素Element stu = rootElement.element("stu");//得到第一个stu下面的ageElement age = stu.element("age");age.setText("18");//回写xmlDom4jUtils.xmlWriters(Dom4jUtils.PATH, document);}}
※ 使用dom4j实现删除节点的操作
package cn.ideal.xml.dom4j;import cn.ideal.xml.utils.Dom4jUtils;import org.dom4j.Document;import org.dom4j.Element;public class TestDom4j8 {public static void main(String[] args) {//得到documentDocument document = Dom4jUtils.getDocument(Dom4jUtils.PATH);//得到根节点Element rootElement = document.getRootElement();//得到第一个stu元素Element stu = rootElement.element("stu");//得到第一个stu下面的ageElement id = stu.element("id");stu.remove(id);//回写xmlDom4jUtils.xmlWriters(Dom4jUtils.PATH, document);}}
※ 使用dom4j获取属性的操作
package cn.ideal.xml.dom4j;import cn.ideal.xml.utils.Dom4jUtils;import org.dom4j.Document;import org.dom4j.Element;public class TestDom4j9 {public static void main(String[] args) {//得到documentDocument document = Dom4jUtils.getDocument(Dom4jUtils.PATH);//得到根节点Element rootElement = document.getRootElement();//得到第一个stu元素Element stu = rootElement.element("stu");//得到stu里面的属性值String value = stu.attributeValue("id1");System.out.println(value);}}
(4) 使用dom4j支持xpath具体操作
XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言
默认的情况下,dom4j不支持xpath
如果想用,需要引入支持xpath的jar包,使用 jaxen-1.1-beta-6.jar
第一种形式/AAA/CCC/BBB: 表示一层一层的,AAA下面CCC下面的BBB
第二种形式//BBB: 表示和这个名称相同,表示只要名称是BBB,都得到
第三种形式/*: 所有元素
第四种形式BBB[1]: 表示第一个BBB元素BBB[last()]:表示最后一个BBB元素
第五种形式//BBB[@id]: 表示只要BBB元素上面有id属性,都得到
第六种形式//BBB[@id='b1'] 表示元素名称是BBB,在BBB上面有id属性,并且id的属性值是b1
dom4j里面提供了两个方法,用来支持xpath
//获取多个节点selectNodes("xpath表达式")//获取一个节点selectSingleNode("xpath表达式")
(一)使用xpath实现:查询xml中所有name元素的值
package cn.ideal.xml.dom4j.xpath;import cn.ideal.xml.utils.Dom4jUtils;import org.dom4j.Document;import org.dom4j.Node;import java.util.List;public class TestDom4jXpath1 {//查询xml中所有name元素的值public static void main(String[] args) {//得到documentDocument document = Dom4jUtils.getDocument(Dom4jUtils.PATH);//获取所有name元素List<Node> list = document.selectNodes("//name");//遍历list集合for (Node node : list) {//node是每一个name元素//得到name元素里面的值String s = node.getText();System.out.println(s);}}}
(二)使用xpath实现:获取第一个stu下面的name的值
package cn.ideal.xml.dom4j.xpath;import cn.ideal.xml.utils.Dom4jUtils;import org.dom4j.Document;import org.dom4j.Node;public class TestDom4jXpath2 {public static void main(String[] args) {//得到documentDocument document = Dom4jUtils.getDocument(Dom4jUtils.PATH);Node name1 = document.selectSingleNode("//stu[@id1='love']/name");//得到name里面的值String s1 = name1.getText();System.out.println(s1);}}
(4) 使用 Jsoup 操作 xml
package cn.ideal.xml.jsoup;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;import java.io.File;import java.io.IOException;public class JsoupDemo1 {public static void main(String[] args) throws IOException {//获取Documnet对象//通过类加载器,获取student.xml的pathString path = JsoupDemo1.class.getClassLoader().getResource("student.xml").getPath();//解析xml文档,加载文档进内存,获取dom树 --> DocumentDocument document = Jsoup.parse(new File(path), "utf-8");//获取元素对象 ElementElements elements = document.getElementsByTag("name");//获取第一个nameElement element = elements.get(0);//获取数据String name = element.text();System.out.println(name);}}
对上述常用对象的解释
1. Jsoup:工具类:可以解析html或xml文档,返回Document
parse:
//解析xml或html文件parse (File in, String charsetName)//解析xml或html字符串parse (String html)//通过网络路径获取指定的html或xmlparse (URL url, int timeoutMillis)
2. Document:文档对象:代表内存中的dom树
A:获取Element对象
//根据id属性值获取唯一的element对象getElementById (String id)//根据标签名称获取元素对象集合getElementsByTag (String tagName)//根据属性名称获取元素对象集合getElementsByAttribute (String key)//根据对应的属性名和属性值获取元素对象集合getElementsByAttributeValue (String key, String value)
3. Elements:元素Element对象的集合。可以近似的认为 ArrayList<Element>
A:获取Element对象,同2中
B:获取属性值
String attr(String key):根据属性名称获取属性值
C:获取文本内容
//获取文本内容String text()//获取标签体的所有内容String html()
两种更加快捷的查询方式
selector:选择器
Elements select(String cssQuery)//具体语法,看文档格式<?xml version="1.0" encoding="UTF-8"?><student><stu number="stu_001"><name id="ideal">zhangsan</name><age>18</age></stu><stu number="stu_002"><name>lisi</name><age>30</age></stu></student>package cn.ideal.xml.jsoup;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.select.Elements;import java.io.File;import java.io.IOException;public class SelectorDemo {public static void main(String[] args) throws IOException {//获取Documnet对象//通过类加载器,获取student.xml的pathString path = JsoupDemo1.class.getClassLoader().getResource("student.xml").getPath();//解析xml文档,加载文档进内存,获取dom树 --> DocumentDocument document = Jsoup.parse(new File(path), "utf-8");//查询name标签Elements elements1 = document.select("name");System.out.println(elements1);System.out.println("--------------");//查询id值为 stu_001Elements elements2 = document.select("#ideal");System.out.println(elements2);System.out.println("--------------");Elements elements3 = document.select("stu[number='stu_001']");System.out.println(elements3);}}//运行结果<name id="ideal">zhangsan</name><name>lisi</name>--------------<name id="ideal">zhangsan</name>--------------<stu number="stu_001"> <name id="ideal">zhangsan</name> <age>18</age> </stu>
XPath
package cn.ideal.xml.jsoup;import cn.wanghaomiao.xpath.model.JXDocument;import cn.wanghaomiao.xpath.model.JXNode;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import java.io.File;import java.util.List;public class XpathDemo {public static void main(String[] args) throws Exception {//获取Documnet对象//通过类加载器,获取student.xml的pathString path = JsoupDemo1.class.getClassLoader().getResource("student.xml").getPath();//解析xml文档,加载文档进内存,获取dom树 --> DocumentDocument document = Jsoup.parse(new File(path), "utf-8");//创建JXDocument对象JXDocument jxDocument = new JXDocument(document);//结合xpath语法查询List<JXNode> jxNodes = jxDocument.selN("//stu");for (JXNode jxNode : jxNodes) {System.out.println(jxNode);}}}//运行结果<stu number="stu_001"> <name id="ideal">zhangsan</name> <age>18</age> </stu><stu number="stu_002"> <name>lisi</name> <age>30</age> </stu>//查询stu标签下的name标签List<JXNode> jxNodes = jxDocument.selN("//student/name");//查询stu标签下带有id属性且属性值ideal的name标签List<JXNode> jxNodes = jxDocument.selN("//stu/name[@id='ideal']");
结尾:
如果内容中有什么不足,或者错误的地方,欢迎大家给我留言提出意见, 蟹蟹大家 !^_^
如果能帮到你的话,那就来关注我吧!(系列文章均会在公众号第一时间更新)
在这里的我们素不相识,却都在为了自己的梦而努力 ❤
一个坚持推送原创Java技术的公众号:理想二旬不止