Jsoup
大象Jepson
大象:真诚,自然,简单,快乐!
展开
-
Jsoup学习笔记5:Jsoup 解析SAZ文件中的htm文档源码实例
上一篇Jsoup学习笔记的小例子实现的功能是:解析saz格式文件中的htm文档,提取其中table标签内的数据,将解析到的数据写入txt文件中。本节做了一些改进,实现把提取的数据按照一定格式写入csv文档中,附件是解析前的_index.htm文档,仅供参考。示例如下 :package com.daxiang.myjsoup;import java.io.File;import原创 2015-07-10 14:37:41 · 1143 阅读 · 0 评论 -
Jsoup学习笔记9:Jsoup 解析saz文件,读取其中的htm文件到字符串,提取字符串中的数据写入csv文件中
本篇笔记将上篇笔记的操作做些改进,不再把saz文件中的htm文件解析出来,而是不解压直接读取其中的数据成字符串,基本思路如下:1、自定义一个从文本文件读取内容到字符串的类:解析saz文件中的htm文档,将文件的内容读取到字符串中2、自定义利用Jsoup解析htm字符串的类:利用Jsoup解析传入的htm字符串,将解析结果写入csv文件中3、解析时,指定好文件路径,直接调用上原创 2015-08-04 09:38:55 · 1465 阅读 · 0 评论 -
Jsoup学习笔记6之File类操作文件:获取指定目录下面,指定扩展名(.saz)的文件,并在对应的文件夹下生成同名的csv文件。
虽然这篇笔记涉及的主要是文件的操作,但是是在做的利用Jsoup解析文档小任务的一部分,所以也放在一起,借鉴了帖子上的源码,做了一些改动,下一篇笔记是基于本篇的进一步改进!实例如下:package com.daxiang.filenamefilter;/** * File类操作文件综合应用 * 需求:获取指定目录下面,指定扩展名(.saz)的文件,将文件的绝对路径写到文本文件当中,原创 2015-07-22 15:05:08 · 1498 阅读 · 0 评论 -
Jsoup学习笔记1:解析字符串
Jsoup是Java的一个解析和遍历HTML的API,可以把一个HTML字符串解析成一个Document文档,并且会尽可能的得到一个标准的解析结果,会自动补充缺失的结束标记。例如:"JsoupJsoup"会解析为"JsoupJsoup",官方文档说会创建隐式标签,即"Jsoup"会解析为Jsoup",但是经验证并不会创建,而是会忽略td标签,解析为"Jsoup",会自动创建完整的HTML页面结转载 2015-07-02 14:53:28 · 1655 阅读 · 0 评论 -
Jsoup学习笔记7之File类操作文件:复制只包含指定类型文件的文件夹,并在新创建的同名文件夹中创建同名的另一种格式的文件
接着上一篇的笔记做一些改进,之前看过的File类操作文件夹的文章都只是复制指定目录下的文件夹和文件,没有任何筛选,现在要做的是在前人的基础上,实现只复制包含指定格式文件的文件夹,并在新创建的同名文件夹中创建同名的另一种格式的文件,具体的功能如下(说的有点绕,看代码和实现结果图就明白了):1、获取指定目录下面,指定扩展名的文件,2、在另一个目录中复制包含指定文件的所有文件夹,并在创建的同名文原创 2015-07-22 15:19:00 · 709 阅读 · 0 评论 -
Jsoup学习笔记4:Jsoup 解析Html源码实例
结合前面的学习笔记,自己写了一个Jsoup解析Html文档的小例子,具体功能是:解析Html文档中table标签内的数据,将解析到的数据写入txt文件中,继续学习吧!示例如下 :package com.daxiang.myjsoup;import java.io.File;import java.io.FileWriter;import java.io.IOException;原创 2015-07-03 15:55:17 · 810 阅读 · 0 评论 -
Jsoup学习笔记3:Jsoup 解析Html源码实例
看到的Jsoup解析Html的实例中解释最详细一篇文章,转载自:http://blog.csdn.net/xyw_eliot/article/details/8927862为了便于更好的理解,关于Jsoup的使用方法,具体可以参见Jsoup中文开发指南:Jsoup中文开发指南转载 2015-07-03 14:19:24 · 690 阅读 · 0 评论 -
Jsoup学习笔记8:Jsoup 解析指定目录中的saz文件,生成一个名字相同的htm文件,将解析结果写入csv文件中
本篇笔记和前面的Jsoup学习笔记有连贯性,有些小细节不明白的可以查看前面几篇笔记,要实现的功能是:1、解析指定目录中的saz文件,生成一个名字相同的htm文件 2、解析生成的htm文件,提取其中table标签内的数据3、将解析到的数据写入csv文件中,生成一个名字相同的csv文件示例代码如下:package com.daxiang.saztest;/** * @Auth原创 2015-07-23 16:30:54 · 1211 阅读 · 0 评论 -
Jsoup学习笔记2:Jsoup解析HTML代码标签与属性
转载自:http://jilongliang.iteye.com/blog/1922295?utm_source=tuicool接着上一篇的Jsoup学习笔记1继续学习,虽然是转载自上面链接的文章,但是程序做了一点改动,方便自己以后的查看package com.daxiang.myjsoup;import org.jsoup.Jsoup; import org.jsoup.node转载 2015-07-03 11:18:03 · 2661 阅读 · 0 评论 -
Jsoup学习笔记10:Saz2Csv解析器
经过了一系列的学习和摸索,Jsoup学习笔记即将告一段落,第11篇学习笔记将会把本篇实现的功能界面化,并做成一个可直接执行的exe文件。后续的项目如果需要更深入的学习Jsoup,还会继续更新。 本篇笔记主要是对前面的9篇笔记进行整合,初步实现saz格式文件到csv文件转换的基本功能,程序要实现的基本功能主要是:1、saz文件遍历:获取Java工程所在目录的上层目录中,指定扩展名(原创 2015-08-04 10:40:00 · 1006 阅读 · 0 评论