- 博客(11)
- 收藏
- 关注
转载 JFreeChart 典型图表
import java.awt.Color;import java.awt.Font;import java.awt.Rectangle;import org.jfree.chart.ChartFactory;import org.jfree.chart.JFreeChart;import org.jfree.chart.axis.AxisLocation;import o
2012-10-16 17:58:09
1311
转载 vi,gvim UTF8编码乱码解决
首先,可尝试修改系统编码命令:set encoding=cp936set termencoding=utf-8set fileencoding=chineseset fileencodings=ucs-bom,utf-8,chinese,cp936set langmenu=zh_CN,utf-8如果在使用VI的时候出现提示信息乱码,可改用VIM编辑。在G
2012-07-06 14:51:35
334
转载 ictclas4j人名分词bug
不知道用ictclas4j的人多不多,该项目地址是http://code.google.com/p/ictclas4j/ 关于ictclas分词系统讨论组地址是http://groups.google.com/group/ictclas其中在ictclas4j项目的issues中有人提到一个问题“程序分词最后结果会吃掉一些字”,也就是漏字、漏词的问题。问题地址为http://cod
2012-05-25 10:11:36
469
ictclas4j人名分词bug
不知道用ictclas4j的人多不多,该项目地址是http://code.google.com/p/ictclas4j/ 关于ictclas分词系统讨论组地址是http://groups.google.com/group/ictclas其中在ictclas4j项目的issues中有人提到一个问题“程序分词最后结果会吃掉一些字”,也就是漏字、漏词的问题。问题地址为http://cod
2012-05-25 10:10:03
60
转载 Libxml2库的编译和使用
Libxml2库提供了C语言解析和构造xml文档的接口,为后台C语言处理程序和前台应用程序提供了一种通用的通迅方式。本文以libxml2-2.6.30版本来说明Libxml2库的使用方法。1. 编译库文件libxml2-2.6.30.tar.gz文件解压后,进入libxml2-2.6.30文件夹,顺序执行以下命令:chmod +x ./configure
2012-03-16 17:33:50
1756
转载 linux下配置mysql++
1.软件环境ubuntu10.10 2. 安装mysql -- sudo apt-get install mysqlserver 3. 安装 libmysqlclient15-dev -- sudo apt-get install libmysqlclient15-dev(如果提示没有安装包,可以用sudo apt-get install update和sudo apt-g
2012-03-16 15:13:01
629
转载 CMake的安装和使用
1. cmake安装(1)从源码安装下载cmake源码cmake-2.6.2.tar.gzhttp://www.cmake.org/cmake/resources/software.html编译安装tar xvf cmake-2.6.2.tar.gzcd cmake-2.6.2/如果本机上不存在cmake,则:./bootstrapmakemake i
2012-03-14 17:56:49
271
转载 JAVA读取文件大全
1、按字节读取文件内容2、按字符读取文件内容3、按行读取文件内容4、随机读取文件内容 public class ReadFromFile { /** * 以字节为单位读取文件,常用于读二进制文件,如图片、声音、影像等文件。 */ public static void readFileByBytes(String fileN
2011-12-09 17:06:44
202
转载 JAVA正则表达式入门
Java作为一种开发语言,有许多值得推荐的地方,但是它一直以来没有自带对正则表达式的支持。直到最近,借助于第三方的类库,Java开始支持正则表达式,但这些第三方的类库都不一致、兼容性差,而且维护代码起来很糟糕。在Sun的Java JDK 1.40版本中,Java自带了支持正则表达式的包,终于能够支持正则表达式了。与一般语言有点不同的是:对java的解释器来说,在反斜线字符(/)前的字符
2011-12-09 17:04:17
413
原创 使用heritrix抓取特定页面
扩展 FrontierScheduler 来抓取特定网站内容FrontierScheduler 是 org.archive.crawler.postprocessor 包中的一个类,它的作用是将在 Extractor 中所分析得出的链接加入到 Frontier 中,以待继续处理。在该类的 innerProcess(CrawlURI) 函数中,首先检查当前链接队列中是否有一些属于高优先级的链
2011-12-01 16:54:11
3324
1
转载 Heritrix Eclipse下环境配置
在http://sourceforge.net/projects/archive-crawler/files/archive-crawler%20%28heritrix%201.x%29/1.14.4/下载heritrix, heritrix-1.14.4-src.zip 中包含原始的源代码,方便进行二次开发。本文需要用到 heritrix-1.14.4-src.zip,将其下载并解压至 heri
2011-11-27 20:38:29
2274
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人