jsoup
xml格式数据原生解析有pull和sax两种方式,主要是有两个不同的工厂类XmlPullParserFactory和SaxParserFactory。
介绍一种框架解析jsoup。
/*
* 1.使用 Jsoup 载入 Html 数据功能
* 数据内容可以是:html文本、url、本地html
*/
//1.html文本
Document doc = Jsoup.parse(html);
//可以获取到html中<title>的值
doc.title();
//2.url
try {
//通过GET方式请求
Document doc2 = Jsoup.connect(url).get();
//通过POST方法请求
// Document doc2 = Jsoup.connect(url).data("key","value").timeout(3000).post();
} catch (IOException e) {
e.printStackTrace();
}
//3.本地html
//获取本地html文件
File file = new File(Environment.getExternalStorageDirectory()+"/index.html");
//parse()方法参数解释:1.html文件 2.html的编码格式(本地html文件是什么编码就写什么编码) 3.当本地html文件中的图片或者链接采用的是相对路径时,就可以通过指定的baseUri替换路径的前缀。eg:.../baidu.png-->http://baidu.com/baidu.png
try {
Document doc3 = Jsoup.parse(file, "utf-8", "http://baidu.com");
} catch (IOException e) {
e.printStackTrace();
}
/*
* 2.使用 Jsoup 解析并提取 HTML元素功能
*/
Elements eles = doc.getElementsByTag("a");//将a标签的列表存储成元素集合
for (Element link : eles) {
//获取a标签中href的属性值
String linkHref = link.attr("href");
//获取a标签中的文本值
String text = link.text();
}
//检索元素功能
//检索html文件中的a标签并且就有href属性的a标签列表存储成元素集合
Elements elements = doc.select("a[href]");
//检索html文件中有img标签的.png格式的图片
Elements elements2 = doc.select("img[src$=.png]");
//检索出元素名为className的div标签的元素
Element element3 = doc.select("div.className").first();
/*
* 3.使用 Jsoup 修改数据属性功能
*/
//对元素名为className的div标签添加属性,属性名为key,属性值为value
doc.select("div.className").attr("key","value");
//为元素名为className的div标签添加属性类,添加的属性为:class="myclass"
doc.select("div.className").addClass("myclass");
//移除img标签的onClick属性
doc.select("img").removeAttr("onClick");
/*
* 4.使用 Jsoup HTML 文档清理功能
*/
String htmls = "";//不安全的一个html代码
String safe = Jsoup.clean(htmls, Whitelist.basic());//用基本的白名单将不安全的html代码转换为安全的html
}
json解析
可以通过jsonObject和jsonArray来解析json和json数组
还有框架介绍Gson
导入jar包后
String jsonData="";
Gson gson = new Gson();
Person person = gson.fromJson(jsonData,Person.class);//解析json数据
List<Person> people = gson.fromJson(jsonData,new TypeToken<List<Person>>(){}.getType());//解析json数组``