自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

志远的博客

开发点滴记录

  • 博客(4)
  • 收藏
  • 关注

翻译 tika in action之1.1.2(文库分析程序)

为了能够从数字文件中提取信息,你需要理解文件的格式。所编写的程序是为了与这些不同的文件一同工作(Suchunderstanding is built into the applications designed to work with specifickinds of documents.)。例如,微软office主键是用于读写word文档,然而Adobe Acrobat和Acrobat R

2016-04-30 23:50:54 1017

翻译 tika in action之1.1.1(文件格式的分类)

为了写完成上面所提到的搜索引擎,你必须理解不同的文件格式和自己要存储的文本和资料方法论。第一步要做的是能够识别和区分不同的文件类型。我们不多数人只是了解日常中一些常用文件类型的术语,例如,spreadsheet,webpage,但是这些属于不能够准确地用在计算机程序中。通常,在文件名后缀的结尾处的信息,例如,xls,html这些出现在mac系统和其他进程的文件信息,是用来识别文件的格式。不幸的是,

2016-04-30 23:48:07 855

翻译 tika in action之1.1(理解数字文件)

1.1理解数字文件         数字文件及其文件格式的世界就像一个宇宙,当中的每一个都有其自己的语言。大多数程序只是理解他们自身的文件格式和一小部分相关的格式,在1.1章节中所提到的的转换器中,例如当一个程序需要通过另一个程序来读取文件时,通常需要导出模块或者显示插件。         在使用中,存在着有上千个不同类型的文件格式,并且大多数格式都有着不同的版本和语言。例如使用最为广泛的

2016-04-30 23:45:05 1011

原创 LokiJS入门demo1

var db=new loki("hello.json"); //用new loki来创建数据库,使用localStarge来作为底层的数据存储时,loki的参数是localStorage的key的名称 db.loadDatabase(); //初始化db后,我们调用loadDatabase方法来从localStorage中获取内容 var coll=

2016-04-30 23:31:16 4963 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除