- 博客(8)
- 资源 (3)
- 收藏
- 关注
转载 WordNet发展概况
一 WordNet发展概况· 关于WordNet的不成熟的想法可以追溯到20多年前,而这一想法开始逐渐具体化和清晰化则是1985年后才开始的。从85年开始,WordNet作为一个知识工程全面展开。不过,当时的WordNet和经过10多年后今天的WordNet还是很不一样的。· 这一工程最初的前提之一是“可分离性假设”(Separability hypothesis),即语言的词汇成分可以被离析出来
2008-03-06 14:32:00 1226 1
转载 搜索引擎中链接分析的HITS算法
HITS算法是由Kleinberg在90年代末提出的一种链接分析算法,与随后我们将介绍的PageRank等实用性算法不同,HITS算法更大程度上是一种实验性质的尝试。它必须在网络信息检索系统进行面向内容的检索操作之后,基于内容检索的结果页面及其直接相连的页面之间的链接关系进行计算。这使得在实际应用环境中使用HITS算法变得十分困难,尽管有人尝试通过算法改进和专门设立链接结构计算服务器(Conne
2008-01-15 11:16:00 1329
原创 VMare安装Linux
VMware workstation就是一个虚拟机软件,它可以在你现有的操作系统上虚拟出一个新的子机,这个子机一方面是建立在你正在运行的操作系统之上的,同时,它又拥有自己独立的CPU,硬盘,内存及各个硬件,当然,这些都是虚拟出来的,虚拟子机的CPU是通过i386的保护模式实现的,虚拟的硬盘其实就是母机上的一个文件,内存当然是从物理中划出一块,别的如网络设备也都是通过某种途径实现的.有了VMwa
2007-12-16 21:55:00 2294 1
转载 Windows与VMware下Linux的文件共享问题
Windows与VMware下Linux的文件共享问题 这里以Windows XP、VMware Workstation 5.5.2、RedHat Linux9.0为例,其它环境类似。 1. 准备工作打开VMware WorkStation,并启动RedHat Linux。选择菜单VM->Install VMware Tools将安装文件载入Linux的/mnt/cdrom,然
2007-12-16 21:53:00 1046
原创 计算机核心期刊新排名
计算机核心期刊新排名 新排名 2004部分核心期刊名单(自动化、计算机部分与无线电、电信部分)自动化、计算机部分1 计算机学报 北京 中国计算机学会等2 软件学报 北京 中国科学院软件研究所3 计算机研究与发展 北京 中国科学院计算技术研究所等4 自动化学报 北京 中国科学院等5 计算机科
2007-12-09 16:09:00 2016 1
原创 利用spectral clustering算法进行文档结构与内容结合的一点建议
考虑结合两个特征来聚类。简单的说在聚类相似性度量的时候,可以进行加权综合考虑这两个因素。如果这两个特征能够相互作用,那么首先可以考虑对它们分别聚类,然后考虑它们之间相互作用是否对原聚类是否有作用,是否还要重新聚类。例如在web使用挖掘中。首先分别对用户,网页内容聚类。因为用户必然要访问网页,因此它们之间就形成了相互作用,重新聚类。总的来说就是分为两层。层与层之间相互作用。
2007-11-29 21:21:00 1511 1
转载 Normalized Cut技术
所谓Clustering,就是说聚类,把一堆东西(合理地)分成两份或者K份。从数学上来说,聚类的问题就相当于Graph Partition的问题,即给定一个图G = (V, E),如何把它的顶点集划分为不相交的子集,使得这种划分最好。其难点主要有两个:1. 这个“合理”其实相当难达到,随便设一个目标函数可能达不到希望的结果。大家可以看了看[1],这里详细地讨论了一下准则的选择问题。2. 即使我们
2007-11-29 19:07:00 10442 3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人