自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

图解说明如何在Word文档第一页设置页脚

目的:在WORD文档的第一页设置页脚,其它页没有页脚。环境:WORD 2007步骤:1、选择“视图->普通视图”2、在第二页开始的位置插入“下一页分节符”,也即选择“页面布局->分割符->分节符(下一页)”,见图1,图23、选择“视图->页面视图”4、选择“插入->页脚”,选择所需页脚格式,此处选择"空白"5、在第一页编辑想要的页脚...

2011-08-17 17:58:08 3273

Selenium使Firefox测试提示不信任站点的问题

1、问题Selenium启动Firefox测试HTTPS站点时会提示站点不信任,需要手动添加信任站点。即使是在Firefox中已经添加过例外了,但依然在每次测试时需要手动添加。2、原因Selenium每次启动Firefox时,都是重新建立一个profile作为启动的profile,因此无论之前怎么把站点设为可信任站点,每次Selenium启动时仍然是一个新的profile,因此会提...

2011-08-03 15:00:27 711

用Eclipse和Pydev搭建Python开发环境

1、安装Eclipse下载Eclipse,解压到想安装的目录,本文为:D:\eclipse2、安装Pydev可参考官方文档:http://pydev.org/manual_101_install.html以下列出具体步骤: (1) Eclipse->Help->Install New Software... (2) 点击Add添加安装地址 (3) 选择P...

2011-08-02 17:29:12 125

在Windows中用Python调用rar实现文件备份

《简明Python教程》中,有在Linux下面进行文件备份的一段简单程序。现在Win7下实现类似的功能,并验证通过。 1、在命令行里面测试rar的使用假设WinRar的安装路径是C:\Program Files\WinRAR,则首先进入该目录: cd C:\Program Files\WinRAR rar /?命令可以提示该命令的使用方法,找到说明后,使用如下: ...

2011-07-13 14:29:40 237

在Windows中开发linux程序:Cygwin安装方法(附安装包下载)

Cygwin是在windows平台上运行的linux模拟环境,安装步骤如下:1、下载安装向导文件setup.exe到Cygwin下载安装官方下载安装向导文件,通过它才能正确下载最新版本的Cygwin。本文附件中也有setup.exe的下载。2、运行安装程序,点“下一步”进入安装模式选择画面。安装模式有"Install from Internet"、"Downlo...

2011-05-15 18:21:16 235

使用ICTCLAS JAVA版(ictclas4j)过程中的错误及其解决

1.在Dictionary.java里面的getMaxMatch()函数里要注意加上对wis的判断语句if(wis != null)否则有时会报出越界错误。 2.在PosTagger.java里面的computePossibility()函数里要注意将对i的判断语句i < startPos + length  改为i < startPos + length ...

2010-08-20 18:07:56 193

用xpdf和pdfbox来处理中文PDF文档及其比较

我在以前的项目中使用的是pdfbox,在读取中文文档时可以读出大部分的文字,但是在数字、分页等地方还是不可避免的出现乱码。于是我在网上搜索,看有没有什么解决方法,看到有说法: “PDFBox看起来非常的方便,它的API功能强大。甚至能和Lucene进行无缝的结合。但是它有一个致命的弱点,就是它不支持中文。要提取中文的文本,可以采用另一个非常出色的工具xpdf。” 于...

2010-08-20 17:58:56 1049

使用ictclas4j过程中产生的内存不足问题及其解决方法

在读取中文pdf文档的内容并对用ictclas4j对其进行分词过程中,在读取pdf这一步上面没有问题(即没有报错,可以正确运行,但是会出现一些乱码,这可能是由于pdfbox包的不够完善,可以通过用xpdf来读取进行一定的改善。) 但是到了分词这一步上面有时候会报错:Exception in thread "main" java.lang.OutOfMemoryError: J...

2010-08-20 17:42:39 167

原创 MyEclipse快捷键与插件大全

转自:http://www.blogjava.net/wenlong/archive/2008/05/28/203564.html  (1)Ctrl+M切换窗口的大小 (2)Ctrl+Q跳到最后一次的编辑处 (3)F2当鼠标放在一个标记处出现Tooltip时候按F2则把鼠标移开时Tooltip还会显示即Show Tooltip Description。 ...

2010-08-20 17:37:56 107

JAVA的JDK环境变量设置

1.安装jdk1.6.0:     执行j2sdk安装程序,自定义路径,我们的安装路径为:C:\Program Files\Java\jdk1.6.02.配置jdk1.6.0 我的电脑->属性->高级->环境变量->系统变量中添加以下环境变量:JAVA_HOME = C:\Program Files\Java\jdk1.6....

2010-08-20 17:22:51 115

原创 Google Docs使用手册

转载:木瓜教程之Google Docs使用手册 Google Docs 是一个基于Web的工具,它有跟Word相近的编辑界面,有一套简单易用的文档权限管理,而且它还记录下所有用户对文档所做的修改。 Google Docs的这些功能令它非常适用于网上共享与协作编辑文档。 Google Docs甚至可以用于监控责任清晰,目标明确的项目进度。对于简单的...

2010-08-20 11:27:20 5455 1

原创 GMail使用技巧一则 - 透过现象看本质

本文来自:http://www.awflasher.com/blog/archives/1218  GMail有一个很“变态”的用法,就是在你的用户名后加上一个加号,然后加上任何字符串都可以使用,例如: awflasher+blog at gmail dot com和awflasher at gmail dot com的作用是完全一样的。 思考一下,...

2010-08-20 11:23:12 406

原创 LZW数据压缩算法

在 LZW算法中使用的术语与LZ78使用的相同,仅增加了一个术语—前缀根(Root),它是由单个字符串组成的缀-符串(String)。在编码原理上,LZW与LZ78相比有如下差别:①LZW只输出代表词典中的缀-符串(String)的码字(code word)。这就意味在开始时词典不能是空的,它必须包含可能在字符流出现中的所有单个字符,即前缀根(Root)。②由于所有可能出现的单个字...

2010-08-20 11:17:53 307

使用ICTCLAS JAVA版(ictclas4j)进行中文分词(附ictclas,停用词表,commons-lang-2.4.jar下载地址)...

一、ICTCLAS的介绍   中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了基于多层隐码模型的汉语词法分析系统 ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58%(最近的973专家组评测结果),...

2010-08-20 11:13:26 304

原创 BWT数据压缩算法

在全文检索中通常要对索引进行压缩存储,在压缩之前如果对文本进行一定的可逆变换能够使之更易压缩,BWT就是这样一种变换.    通过一个例子来介绍BWT,假设一段待转换的文本为:ababc, 则BWT的过程如下: 在T后插入结束符#得到新的文本串T#,循环左移,每次一位,得到一个|T#|行的矩阵,按首字母排序得到M  F = first column of M ...

2010-08-20 11:13:04 1248

原创 范式Huffman编码

范式huffman编码是一种相对于正规的编码而言操作起来简单得多的编码方法,而且其效果能够起到和huffman编码相同的效果。 范式huffman编码的基础还是依靠于huffman编码。 1、首先对需要压缩的数据进行huffman排列,得出这个数据的huffman二叉树的模型。 得到的这个数据很有用,就是得到了每个数据样本到底分配几个bit。比如数据中出...

2010-08-20 11:08:20 606 1

原创 信息熵中的算术编码

算术编码 (转) 我们在上一章中已经明白,Huffman 编码使用整数个二进制位对符号进行编码,这种方法在许多情况下无法得到最优的压缩效果。假设某个字符的出现概率为 80%,该字符事实上只需要 -log2(0.8) = 0.322 位编码,但 Huffman 编码一定会为其分配一位 0 或一位 1 的编码。可以想象,整个信息的 80% 在压缩后都几乎相当于理想长度的 3 倍左右,压...

2010-08-20 11:05:01 613

在Kmplayer中添加sub字幕过大而挡住视频的解决方法

 刚刚开始看绝代商骄,是在hudbt上下的高清版本,但是在添加sub字幕的时候有个小问题,字幕文件太大以至于挡住了视频文件。  解决方法如下:1. 右键->字幕->描绘到VMR表面2. 右键->选项->参数设置(或直接按F2),进入参数设置对话框3. 视频处理->视频渲染器->VMR9未渲染(HQ字幕) (完)create@200...

2010-08-20 10:58:58 409

在Eclipse下将工程打包成jar格式

一、情况说明前段时间自己写了一个工程DocumentToXML,功能是把文件进行一系列信息的提取(文本内容,文件创建时间等),然后生成对应的XML文档。由于需要提交给组里面的其他人使用,因此要求便于移植。之前没有经历过要跟别人合作的,都是自己写了一个工程能够运行就好了,因此还颇费了一番功夫,看看怎么生成jar给别人调用。 二、查阅资料  这里有一些对jar的说明情况。...

2010-08-20 10:56:09 118

JAVA读取文件的创建时间和修改时间

在系统中存在一个文件test.txt,其属性如下:   下面就给出对这个文件的创建时间 和修改时间 读取的代码。 点击这里 查看对文件内容 的读取代码。import java.io.BufferedReader;import java.io.File;import java.io.IOException;i...

2010-08-20 10:33:51 600

JAVA读取系统时间的几种方法及其效率比较

  以下给出三种读取系统时间的方法,并且可以看出, 方法三的效率最高 。import java.text.SimpleDateFormat;import java.util.Calendar;import java.util.Date;import java.util.GregorianCalendar;/** * 读取当前系统时间 */public cla...

2010-08-20 10:27:52 678

原创 POI,PDFBOX,JDOM的下载地址和在Eclipse中的配置方法

一、POI   POI是Apache的Jakata项目,POI 代表 Poor Obfuscation Implementation,即不良模糊化实现。POI 的目标就是提供一组 Java API 来使得基于 Microsoft OLE 2 Compound Document 格式的 Microsoft Office 文件易于操作。   下载地址 :http://a...

2010-08-20 10:21:36 243

原创 JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例

以下是Java对几种文本文件内容读取代码。其中,OFFICE文档(WORD,EXCEL)使用了POI控件,PDF使用了PDFBOX控件。  点击这里 查看相关控件的下载地址和配置方法。WORDpackage textReader;import java.io.*;import org.apache.poi.hwpf.extractor...

2010-08-20 10:13:42 229

原创 JAVA 读取文件的几个相关类

一 介绍最初Java是不支持对文本文件的处理的,为了弥补这个缺憾而引入了Reader和Writer两个类。java.io下面有两个抽象类:InputStream和ReaderInputStream是表示字节输入流的所有类的超类Reader是用于读取字符流的抽象类InputStream提供的是字节流的读取,而非文本读取,这是和Reader类的根本区别。即用Reader读取出来...

2010-08-20 10:01:35 234

博客迁移

以前的博客http://lycoder.iteye.com/由于各种原因不再更新了~我会将里面的文章陆续转过来~希望大家以后继续支持我~[img]http://dl.iteye.com/upload/attachment/296429/2b822603-8b43-3516-b884-04ae7db37712.bmp[/img]...

2010-08-20 09:43:08 86

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除