Java
文章平均质量分 79
lujianing2011
这个作者很懒,什么都没留下…
展开
-
Java解析 properties
方法一import java.io.InputStream;import java.util.Enumeration;import java.util.List;import java.util.Properties;import java.util.ResourceBundle;import org.junit.Test;/** * 获取*.properties配置文件中的转载 2013-03-21 14:43:23 · 668 阅读 · 0 评论 -
Java解析 HTML
一、垂直搜索介绍1、垂直搜索--即需要抓去大量的网页,分析其中的数据。垂直搜索更着重于正文内容模式分离,数据调整,相关链接分析,是一种结构化分析过程。2、垂直搜索技术主要分为两个层次:模版级和网页库级3、模版级是针对网页进行模版设定或者自动生成模版的方式抽取数据,对网页的采集也是针对性的采集,适合规模比较小、信息源少且稳定的需求,优点是快速实施、成本低、灵活性强,缺点是后期转载 2013-03-21 13:23:46 · 1064 阅读 · 1 评论 -
Java文档 XML
认识XMLXML(Extensible Markup Language)即可扩展标记语言,它与HTML一样,都是SGML(Standard Generalized Markup Language,标准通用标记语言)。XML是Internet环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有力工具。扩展标记语言XML是一种简单的数据存储语言,使用一系列简单的标记描述数据,而这些标转载 2013-03-21 13:20:32 · 882 阅读 · 0 评论 -
Java解析 WORD
一、POI对Word处理1、读取Word1、读取Excel3、下载地址:http://www.apache.org/dyn/closer.cgi/poi/dev/代码实现:package com.qianyan.test; import java.io.File; import java.io.FileInputStream; imp转载 2013-03-21 13:24:58 · 1663 阅读 · 0 评论 -
Java解析 PDF
1、使用PDFBox处理PDF文档PDF全称Portable Document Format,是Adobe公司开发的电子文件格式。这种文件格式与操作系统平台无关,可以在Windows、Unix或Mac OS等操作系统上通用。PDF文件格式将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件中。如果要抽取其中的文本信息,需要根据它的文件格式来进行解析。幸好目前已经有转载 2013-03-21 13:22:00 · 3264 阅读 · 0 评论