【Tika基础教程之一】Tika基础教程
一、快速入门
1、Tika是一个用于文本解释的框架,其本身并不提供任何的库用于解释文本,而是调用各种各样的库,如POI,PDFBox等。
使用Tika,可以提取文件中的作者、标题、创建时间、正文等内容,相比于java.io自带的一些功能(如FileInputStream,FIleReader,Scanner等):
(1)若文档为纯文本,如txt,html,java文件等,则二者对
转载
2014-12-08 20:04:04 ·
1082 阅读 ·
0 评论