自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

学经世致用之学,练锤炼仕艺之术

在路上,走向职业化!

  • 博客(26)
  • 资源 (11)
  • 收藏
  • 关注

原创 本体开发方法——the Method of Ontology Development

    笔者在本体开发导论和 本体开发的有关问题和命名规范这两篇文章中,已经初步论述了本体的相关概念、本体开发的基本内容、本体开发的过程及本体开发的常见问题和概念命名规范,掌握了这些,我们能对本体及其构建有一个初步的认识。现在,我们便可以根据这些已经掌握了的知识来构建自己的本体了。        起初,在我利用相关工具构建完成了领域本体之后,打算写一个如何建本体的详细教程,以使初学这能快速入门

2006-12-29 21:50:00 4546 3

原创 本体开发的有关问题和命名规范——some Problems and Naming Conventions of Ontology development

   笔者在本体开发导论一文中简要的论述了本体开发的一般过程及相关概念的理解,这样我们可以对本体及其开发过程有一个初步的轮廓性的认识。本文将对本体开发中常见的一些问题进行阐述,以及对相关的规范进行介绍。1  概念的命名规范(1)概念命名时不要使用本体中默认的字符,如“class、slot、property”等,否则易引起混淆。(2)在使用英文描述概念时,尽量不要使用缩略词,这样容易引起

2006-12-27 19:09:00 3733 1

原创 本体开发导论——A Introduction to Ontology Development

1  引言     本体是对概念及概念之间的关系的一个明确的形式化的描述。在哲学中,ontology译为客观存在,即一切客观存在的事物。计算机领域将其引入进来,即表示对一切客观存在进行描述,只不过是要求这种描述是显性化的,并且,要求其不但能描述事物本身,还要描述其与其他事物之间的关系。本体最初只在人工智能实验室进行研究,而现在许多领域专家也开始研究和应用本体了,并且取得不错的效果。   

2006-12-27 12:51:00 5768 2

原创 Jena学习笔记(1)---创建RDF模型

    在阅读本文之前,我事先假定读者已完成学习思路和jena学习笔记(0)的内容,并且已经达到了这两篇文章中所要求的基本技能,这样才能容易的理解本文的内容.   RDF可以看作是一个由结点(node)和弧(arc)组成的图,用图来描述资源,事实上,用图也更能让我们理解RDF的含义。本文将具体说明如何用jena创建RDF模型。思路如下:  1。 了解资源,设计RDF图。首先我们要清楚我们需

2006-12-18 19:14:00 4013 1

原创 Jena学习笔记(0)---学习方法

      经过这一个星期的摸索,对jena总算有了点感觉,也形成了一个循序渐进的学习思路。现在已经能够开始尝试着动手调用jena的API来实现一些简单的功能了,这实在是一件让我感到很兴奋的事。然而,由于没有一个明确的向导,自己摸索的道路确实有点苦涩。于是,决定把自己学习过程中碰到的每一个问题以及是如何解决的、和自己的收获记录下来,以供大家参考和作为自己学习资料的备份。因此,在本文将主要说明我在学

2006-12-17 16:28:00 5147 2

原创 java包装类

    java是一种面向对象语言,java中的类把方法与数据连接在一起,并构成了自包含式的处理单元.但在java中不能定义基本类型(primitive type),为了能将基本类型视为对象来处理,并能连接相关的方法,java为每个基本类型都提供了包装类,这样,我们便可以把这些基本类型转化为对象来处理了.这些包装类有:Boolean,Byte,Short,Character,Integer,Lon

2006-12-15 13:28:00 1701

原创 复杂数据结构的排序和检索问题

     前面几篇讨论了利用ArrayList和Collections对数据元素进行排序和折半查找的功能。但排序也仅限于简单结构的排序,如{452,3,5,14,89,632}等,检索也是针对这些简单结构的检索,采用默认的排序算法和比较器就可以进行。但实际应用中却往往没有那么简单,我们经常需要对一个具有复杂数据结构的列表进行排序和检索操作,直接应用其默认算法是不可能实现的。这时,通常需要针对特定的

2006-12-13 21:45:00 1383

原创 jena学习思路

     在用protege建好本体之后,下一步便是需要对本体进行解析.本体解析有许多思路和工具可以使用,甚至可以自己编写本体解析的模块.jena是由HP实验室开发的模块,用于支持语义网应用.为了学习和使用jena,我的确已经花费了不少时间.因为对这个东东一点都不了解,在网上搜集一些信息,比较杂乱,不知从何开始.现在对这个问题已经有了一些了解,总结一些学习思路,以供参考,避免初学者象我最初一样在搜

2006-12-13 17:25:00 4500 2

原创 Ontology,RDFS,OWL

     Ontology的一个初略的描述是:一个本体即是对一个概念的规范。这就意味着,程序员可以以一种很开放和有意义的方式来对某领域内的概念及概念之间的关系进行描述和规范。如葡萄酒本体,可以用白葡萄酒、红葡萄酒、生产日期、生产厂家等概念进行描述,同时,也可以用葡萄酒是由生产厂家生产的,葡萄酒包含白葡萄酒和红葡萄酒两种等来描述概念之间的关系。本体的描述语言有多种,如RDF、RDFS、OWL、DAM

2006-12-12 21:11:00 2078 2

原创 Collections容器的搜索方法

    Collections容器中除了其排序方法之外,还有一个很重要的功能是搜索方法binarySearch()。binarySearch()有多种译法,如折半查找法、二进制搜索法、对半搜索法,我本人比较倾向于读为折半查找法,其基本思想是模拟人们查找字典的模式,即在查找某个字时通常将字典翻到中间一页,如果在该页则找到了该字,如果没有找到,则看该字的编号是在中间这一页之前还是之后,然后再在这一半中

2006-12-12 16:00:00 1400

原创 Collections容器的排序方法

     首先我们需要明白什么是通用容器.通用容器是包含和组织对象集合的数据结构,可以存储任何数据类型的数据,并且这些容器在不同的应用程序中都是可以重用的.如数组、表、堆栈、集合、树和哈稀表等。容器有很多用处,在java.util.Collections类中,它提供了许多处理容器问题的方法,其中最为常用的是其排序sort()方法和用于检索的折半查找法binarySearch(),还有一些其他的方法

2006-12-12 15:29:00 1319

原创 ArrayList的使用

     ArrayList是java容器中最常见的一个类,它支持所有定义在List接口的方法,.它实质是一类特殊的动态数组,通过添加和删除元素,就可以动态的改变数组的长度,并且数组的元素可以是任意类型的数据和对象.并可以较容易的实现对ArrayList中元素的排序、检索和遍历功能。  其构造方法如下:  boolean

2006-12-12 12:07:00 1076

原创 RDF的概念

       RDF:Resource Description Framework,即资源描述框架。采用“资源-属性-属性值”的“主谓宾”结构(或称三元组),提供一种框架容器,并通过XML定义了一套形式化的方法,为机器语义理解的结构基础。        RDF是描述WEB资源的一种框架,提供数据模型和语法,使得独立的机构可以相互交换数据。它可以被计算机读取和理解,但并不是用来向人显示信息的。是

2006-12-11 20:10:00 1866

原创 语料库单字字频统计

    前面通过实验,已经完成了批量文件处理和单文件的单字字频处理的功能,在此基础上, 我们便可以统计语料库的单字字频了.语料库实质就是一批文件的集合,通常为文本文件,所以语料库字频的统计也就是批量文件字频的统计了.语料库单字字频统计的基本思路是:利用File对象的String list()或File[] listFiles方法,获取语料库中的所有文件的文件名 或文件数量,然后循环读取统计每一个文

2006-12-07 13:09:00 2237

原创 单字字频统计

      语言学中经常用统计数据对语言现象进行定量描写,主要用来支持语言的自动分析,其中字频和词频是最基本的统计单位,其中运用的原理主要是概率论。本文主要讨论对于单个文本文件的单字字频统计,其任务是:给定一批语料,统计其中有多少个不同的汉字(即词形,Word Type),每个汉字各出现多少次(即字频,Word Frequency)(由于汉字出现的总次数是一定的,因此可以直接用其出现的次数来代替词

2006-12-06 18:28:00 2549

原创 国标码(GB2312)的自动生成

       前面已提到,汉字是由两个字节构成的,每个字节占八位(8bits),那么每个汉字需要占十六位(16bits).而且由于中文字符的每个字节的最高位为1,则每个字节的ASCII码均大于127(27-1).这是中文处理问题的基础.本文研究的是国标码(GB2312-80),即信息交换用汉字编码字符集---基本集.国标码字符的两个字节的ASCII码都是161--254之间的整数.根据这些信息,我

2006-12-05 15:58:00 3096

原创 汉字编码

    字符是一切文本处理中最基本的单位.中文文本里一般出现的是双字节的中文,有时也有单字节字符.要对中文文本进行分析,首先要掌握中文编码的规则.中文编码包括内码和外码两种,我们在对自然语言进行处理时,只需研究内码.中文字符有好几种编码体系,中国大陆一般用"国标码"(GB2312-80),中国台湾采用的是大五码(BIG-5),另外还有国际扩展码(GBK).本文重点介绍国标码.   国标码不光是汉字

2006-12-04 21:17:00 1344

原创 成批读取文件

      操作单个文件是文件处理中最基本的技巧,而实际应用往往需要处理大量的文件.由于已经有了处理单个文件的技巧,在批量处理文件时便可在单个文件处理的基础上循环操作即可.批量处理文件通常有2种方法,一是利用前面介绍的标准WINDOWS文件打开对话框,用户可以在其中自行选择文件,不过这种操作比较麻烦,在文件太多时,需要花费用户较多的选择和点击时间.另一种方法是,利用File对象的成批处理函数来处理

2006-12-04 14:13:00 1127

原创 给文本文件的每一行按顺序标号

      文件操作是编程的基本操作,特别是在中文分词中,文件的操作更为重要.中文分词的断词阶段会涉及到这一点,要求能够读取语料库中的内容,并对每个词的词频进行标注.本文将根据这个要求,列出代码示例如何进行标注.       下面程序实现的主要功能是:创建一个目标空文件,将源文件的内容按行写入目标文件中,并按源文件的行次给目标文件的每一行顺序标号.代码如下:import java.io.*

2006-12-03 21:14:00 1603

原创 随机访问文件

      实际中,常常需要随机访问物理文件,需要用到RandomAcceesFile类.其构造方法是:      public Random AccessFile(String fileName,String mode).其中,mode="rw"(可读写),"r"(只读).其常用方法是:      void close();关闭流对象,释放资源     long length();获

2006-12-03 15:26:00 1150

原创 消息对话框的使用

   java中 使用消息对话框,要用到javax.swing包中的JOptionPane类的静态方法:  public static void showMessageDialog(Component parentComponent,String message,String title,int messageType).  messageType可以以下5个取值:   JOption

2006-12-03 13:59:00 1069

原创 使用文件对话框打开和保存文件

   文件对话框:使用FileDialog类。其主要方法为:   FileDialog(Frame f,String s,int mode).f对话框所在的窗体,s对话框的名字,     mode=FileDialog.LOAD,FileDialog.SAVE.   public String getDirectory()。获取当前对话框中显示的文件的所属目录。   public St

2006-12-02 19:12:00 1420

原创 File 对象的相关操作和访问(4)

一个小小的应用---文件复制    利用前面已经具备的知识和技能,我们可以实现将一个文件的内容复制到另外一个文件中。程序如下:import java.io.*;public class CopyFile {   public static void main(String args[])throws IOException{    int i;    FileInputStream f

2006-12-01 20:59:00 840

原创 File 对象的相关操作和访问(3)

File Input Stream类 File Input Stream类也需要由File对象来方便其对应于指定的磁盘文件。其构造方法如下:public FileInputStream(File file):由file对象创建一个输入流public FileInputStream(String filename):由filename所表示的对象创建一个输入流int read():从

2006-12-01 20:23:00 874

原创 File 对象的相关操作和访问(2)

 PrintStream类  PrintStream类提供了以文本格式来显示数据的功能,和其他的流类相比,在很多情况下,这显然更符合我们的实际需要.其构造方法是:  public PrintStream(OutputStream out):由out所指定的OutputStream对象创建一个输出流  void close():关闭流对象,释放与该流对象有关的任何资源  void f

2006-12-01 20:12:00 836

原创 File 对象的相关操作和访问(1)

.测试和检查文件   文件(File)操作是计算机程序中最重要也是最基础的功能.java中的File对象表示的是指向磁盘中一个实际的文件或者目录的路径,而不是一个流,不过我们可以从一个表示文件路径的File对象创建与文件相对应的流对象,也可以创建目录的路径对象.本文介绍测试和检查文件,以及访问文件的一些基本操作.   boolean exists() :File对象所引用的文件或者目录是否

2006-12-01 19:57:00 884

Ontology-based Expertise Matching System within Academia

识别学术专长及其水平的方法

2007-10-12

论文:网络信息资源评价

论文原稿:网络信息资源评价

2007-10-12

自适应专长识别与共享模型研究

毕业论文原稿及下载

2007-08-03

网站信息构建(IA)决定因素分析

论文原稿及下载

2007-07-30

网络信息资源评价现状及构建研究

论文原稿及下载

2007-07-30

论数字图书馆门户建设

论文原稿及下载

2007-07-30

web2.0环境下的信息构建研究(一)——信息构建发展的新阶段

论文原稿与下载

2007-07-30

网站信息构建决定因素分析

论文原稿与下载

2007-07-30

网络信息资源评价现状及构建研究

论文原稿及下载

2007-07-30

论数字图书馆门户建设

论文原稿

2007-07-30

业余科研

业余科研

2007-06-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除