
【Jsoup&POI】
jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
喵学长
爱好动漫、游戏的二次元,Java工程师
展开
-
【POI】Apache POI字体/Fonts(八)
本章介绍如何设置不同的字体,应用样式,并在Excel电子表格中显示的方向不同角度的文字。每个系统附带一个很大的字体如 Arial, Impact, Times New Roman,等字体集合也可以用新的字体更新,如果需要的话。同样也有各种风格,其中的字体可以显示,例如,粗体,斜体,下划线,删除线等。字体和字体样式下面的代码用于特定的字体和样式应用于一单元格的内容。import ja转载 2017-10-19 18:40:14 · 4484 阅读 · 0 评论 -
【POI】Apache POI单元格/Cells(七)
输入到电子表格中的任何数据总是存储在一个单元中。我们使用的行和列的标签来识别单元格。本章介绍了如何使用Java编程操纵单元电子表格的数据。创建一个单元格需要创建一个单元之前创建一个行。行是什么?只不过是单元的集合。下面的代码片段用于创建一个单元格。//create new workbookXSSFWorkbook workbook = new XSSFWorkbook(); /转载 2017-10-19 17:11:17 · 491 阅读 · 0 评论 -
【POI】Apache POI电子表格/Spreadsheet(六)
本章将介绍如何创建一个电子表格,并使用Java操纵它。电子表格是在Excel文件中的页面;它包含具有特定名称的行和列。读完本章后,将能够创建一个电子表格,并能在其上执行读取操作。创建电子表格首先,让我们创建一个使用在前面的章节中讨论的引用的类的电子表格。按照前面的章节中,首先创建一个工作簿,然后我们就可以去,并创建一个表。下面的代码片段用于创建电子表格。//Create Bla转载 2017-10-19 16:48:59 · 279 阅读 · 0 评论 -
【POI】Apache POI工作簿(五)
此处的术语“Workbook”指的Microsoft Excel文件。本章完成后,您将能够创建新的工作簿,并可以使用Java程序打开现有工作簿。创建空白工作簿下面简单的程序来创建一个空白Microsoft Excel工作簿。import java.io.*;import org.apache.poi.xssf.usermodel.*;public class CreateWorkB转载 2017-10-19 16:43:30 · 240 阅读 · 0 评论 -
【POI】POI核心类(四)
本章介绍了Apache POI的API,它是至关重要的工作,使用Java程序操作Excel文件有下面几个类和方法。工作簿这是创建或维护Excel工作簿的所有类的超接口。它属于org.apache.poi.ss.usermodel包。是实现此接口的两个类,如下所示:HSSFWorkbook : 这个类有读取和.xls 格式和写入Microsoft Excel文件的方法。它与微软O转载 2017-10-19 15:51:52 · 1668 阅读 · 0 评论 -
【POI】Apache POI环境设置(三)
本章将指导完成Apache POI在Windows和Linux系统为基础的设置过程。 Apache POI可以轻松地安装和集成,下面没有任何复杂的设置过程,通过几个简单步骤,目前Java环境,用户管理是必需安装的。系统要求JDKJava SE 2 JDK 1.5 或以上内存1 GB RAM (推荐)磁盘空间没有最小要求操作系统版本转载 2017-10-19 15:37:05 · 1340 阅读 · 0 评论 -
【POI】Apache POI - Java Excel APIs(二)
本章将介绍一些Java ExcelAPI和它们的特征。有许多厂商谁提供Java Excel相关的API;其中一些将在这一章中讨论。Java Aspose CellsJava Aspose Cells 是一种纯粹的Java授权的Excel API,开发和供应商Aspose发布。这个API的最新版本是8.1.2,发布于2014年7月,是一个丰富而厚重的API(普通Java类和AWT类的组合)设转载 2017-10-19 15:35:06 · 311 阅读 · 0 评论 -
【POI】概叙(一)
很多时候,一个软件应用程序需要生成Microsoft Excel文件格式的报告。有时,一个应用程序甚至希望将Excel文件作为输入数据。例如,一个公司开发的应用程序将财务部门需要所有输出生成自己的Excel。任何Java程序员愿意将MS Office文件的输出,可以使用预定义和只读API来做到。什么是Apache POI?Apache POI是一种流行的API,它允许程序员转载 2017-10-19 15:33:19 · 342 阅读 · 0 评论 -
【jsoup】解析一个HTML字符串
解析一个HTML字符串存在问题来自用户输入,一个文件或一个网站的HTML字符串,你可能需要对它进行解析并取其内容,或校验其格式是否完整,或想修改它。怎么办?jsonu能够帮你轻松解决这些问题解决方法使用静态Jsoup.parse(String html) 方法或 Jsoup.parse(String html, String baseUri)示例代码:S原创 2017-08-21 07:59:05 · 453 阅读 · 0 评论 -
【jsoup】解析一个body片断
解析一个body片断问题假如你有一个HTML片断 (比如. 一个 div 包含一对 p 标签; 一个不完整的HTML文档) 想对它进行解析。这个HTML片断可以是用户提交的一条评论或在一个CMS页面中编辑body部分。办法使用Jsoup.parseBodyFragment(String html)方法.String html = "Lorem ipsum原创 2017-08-21 08:02:33 · 436 阅读 · 0 评论 -
【jsoup】从一个URL加载一个Document
从一个URL加载一个Document存在问题你需要从一个网站获取和解析一个HTML文档,并查找其中的相关数据。你可以使用下面解决方法:解决方法使用 Jsoup.connect(String url)方法:Document doc = Jsoup.connect("http://example.com/").get();String title = doc.title()原创 2017-08-21 08:25:13 · 448 阅读 · 0 评论 -
【jsoup】从一个文件加载一个文档
从一个文件加载一个文档问题在本机硬盘上有一个HTML文件,需要对它进行解析从中抽取数据或进行修改。办法可以使用静态 Jsoup.parse(File in, String charsetName, String baseUri) 方法:File input = new File("/tmp/input.html");Document doc = Jsoup.parse(原创 2017-08-21 08:25:59 · 401 阅读 · 0 评论 -
【jsoup】使用DOM方法来遍历一个文档
使用DOM方法来遍历一个文档问题你有一个HTML文档要从中提取数据,并了解这个HTML文档的结构。方法将HTML解析成一个Document之后,就可以使用类似于DOM的方法进行操作。示例代码:File input = new File("/tmp/input.html");Document doc = Jsoup.parse(input, "UTF-8", "http://原创 2017-08-21 08:29:23 · 674 阅读 · 0 评论 -
【jsoup】使用选择器语法来查找元素
使用选择器语法来查找元素问题你想使用类似于CSS或jQuery的语法来查找和操作元素。方法可以使用Element.select(String selector) 和 Elements.select(String selector) 方法实现:File input = new File("/tmp/input.html");Document doc = Jsoup.p原创 2017-08-21 08:31:28 · 683 阅读 · 0 评论 -
【jsoup】从元素抽取属性,文本和HTML
从元素抽取属性,文本和HTML问题在解析获得一个Document实例对象,并查找到一些元素之后,你希望取得在这些元素中的数据。方法· 要取得一个属性的值,可以使用Node.attr(String key) 方法· 对于一个元素中的文本,可以使用Element.text()方法· 对于要取得元素或属性中的HTML内容,可以使用Element.html(), 或 Nod原创 2017-08-22 08:19:24 · 686 阅读 · 0 评论