研究技术综合
文章平均质量分 66
summerbell
这个作者很懒,什么都没留下…
展开
-
获取元组
获取元组 假设校长关系的一个迭代模式为“X#Ni校长/n#OY#Nh认为/v#O”,具体元组抽取方法如下:(1)首先获取模式中的上下文,并将其组合在一起作为查询输入到搜索引擎。上面例子所构造的查询为“校长+认为”;(“校长*认为”),google通配符。(2)从搜索引擎中获取包含所有上下文片段的句子。其中一个句子为:“美国耶鲁大学校长理查德·莱文认为一教学方法影响创新能力培养”;...原创 2009-09-16 10:28:29 · 247 阅读 · 0 评论 -
Rand指数
Rand指数为Milligan和Cooper[]提出的一种评价聚类结果的指标,用来衡量聚类结果与数据的外部标准类之间的一致程度。给定一组个体的集合X={xi, i=1, …, n},假定S={s1, s2, …, sk}与R={r1, r2, …, rk}为2种不同划分(如S为外部标准类,R为聚类结果)。若a为S与R中都属于同一类的个体对数,b为S中属于同一类而R中不属于同一类的个体对...原创 2010-12-17 15:58:53 · 2488 阅读 · 0 评论 -
curriculum vitae
Benxiong Huang received the B.S. in 1987 and Ph.D. in 2003 from Huazhong University of Science and Technology. He is currently a professor in the Department of Electronics and Information Engine...原创 2010-06-12 17:46:36 · 367 阅读 · 0 评论 -
查询扩展
查询扩展 在自然语言文本中,描述同一个主题的词项倾向于共同出现在与该主题相关的文档中。根据这一现象,可以利用词项之间的共现信息来选取扩展词。 term ws, term wt, document D, collection S with size n. 其中 df(.|C)表示S中出现某个词项的文档的数目,μ为一个大于0的可调参数...原创 2009-09-01 15:50:54 · 838 阅读 · 0 评论 -
BM25公式
其中q、d、C分别表示查询、文档和文档集合,|q|和|d|分别是查询q和文档d的长度,avdl是文档集合中文档的平均长度。w表示特征词项(Term),c(w,d)和c(w,q)分别表示w出现在d和q中的个数,N是文档集合中的文档总数,df(w)表示出现w的文档个数。p(w|C)表示C中出现w的概率。公式中的k1,k3,b,都是人工经验调节的参数。 BM25模型是一个经验启...原创 2009-08-23 17:50:42 · 286 阅读 · 0 评论 -
数学之美 系列九 -- 如何确定网页和查询的相关性
[我们已经谈过了如何自动下载网页、如何建立索引、如何衡量网页的质量(Page Rank)。我们今天谈谈如何确定一个网页和某个查询的相关性。了解了这四个方面,一个有一定编程基础的读者应该可以写一个简单的搜索引擎了,比如为您所在的学校或院系建立一个小的搜索引擎。] 我们还是看上回的例子,查找关于“原子能的应用”的网页。我们第一步是在索引中找到包含这三个词的网页(详见关于布尔运算的系列)。现在任...原创 2009-08-23 16:18:49 · 71 阅读 · 0 评论 -
期刊列表
World Wide Web1386-145X COMPUTER SCIENCE, INFORMATION SYSTEMS B SCI0.794-1.763 COMPUTER SCIENCE, INFORMATION SYSTEMS 49 87 国际一般http://www.editorialmanager.com...2010-04-22 14:29:05 · 116 阅读 · 0 评论 -
Web Page Retrieval in Ubiquitous Sensor Environments
摘要本文提出一个“查询自由web搜索”的概念,应用于日常生活。我们通常受益于我们所忙碌的日常行为所增加的附加当信息。比如洗咖啡壶的时候,如果我们得到这样的信息:“用醋洗咖啡壶可以有效去除污点”,我们可以从中受益。我们提出的方法自动的搜索包括这类网信息的网页,关联到正在从事的活动。我假设无线传感器节点已经附加到日常物件,并且可以探测物件的使用;我们的方法生成一个查询,根据正在使用的物件。继而,我...2009-07-17 00:39:20 · 70 阅读 · 0 评论 -
CCF公布推荐的国际学术会议和期刊目录
CCF公布推荐的国际学术会议和期刊目录 经过3年多的工作,CCF推荐的国际学术会议和期刊目录现予公布。本目录包括数据库、软件工程、计算机网络、计算机图形学(几何造型、多媒体、可视化、虚拟现实)、计算机体系结构、计算机科学理论、人工智能与模式识别、网络与信息安全等八个方向的国际学术会议及期刊目录和一个综合类的国际学术期刊目录,供国内高校和科研单位作为学术评价的参考依据。目录中,刊物和会议...原创 2010-10-12 14:47:34 · 614 阅读 · 0 评论 -
Standard treebank POS tagger
Standard treebank POS tagger 1.CCCoordinating2.CDCardinal3.DTDeterminer4.EXExistential5.FWForeign...原创 2011-03-12 14:48:48 · 156 阅读 · 0 评论 -
参考文献
专著(M:Monograph);论文集(C:Collected papers);学位论文(D:dissertation );报告(R:Report);期刊文章(J:Journal);报纸文章(N:Newspaper article );标准(S:Standardization)专利(P:Patent literature) ...原创 2011-04-10 23:22:58 · 172 阅读 · 0 评论 -
Web-based Services and Information Systems
[Dbworld] Web-based Services and Information SystemsSpecial Issue Call for PaperWeb-based Services and Information Systems World Wide Web: Internet and Web Information Systems (WWWJ) The ra...原创 2011-04-08 23:21:27 · 224 阅读 · 0 评论 -
词序列核函数
词序列核函数 Case 1:ACB & ACBA ACBA ACB 2αA2α2AααBα2BααCα2Cα...2011-03-21 17:23:43 · 168 阅读 · 0 评论 -
半监督分类点滴
半监督分类点滴 如果仅使用有标记样本,问题规模将受到很大的限制。 如果仅使用少量的有标记样本,利用它们训练出的学习系统往往很难具有强泛化能力。 半监督学习的核心思想在于光滑性假设:(1)距离越近的点越倾向于拥有相同的标记;(2)数据的分布具有某种内在结构(簇或流形)。 传统的监督学习也是依赖光滑性假设的,但这些算法一般只考虑局部...原创 2011-10-14 10:55:59 · 161 阅读 · 0 评论 -
关于期刊
Web Mining相关国际会议期刊及影响因子列表(欢迎大家补充) Journals:10. Journal of Artificial Intelligence Research: 2.45 (top 0.81%) http://www.informatik.uni-trier.de/~ley/db/journals/jair/index.html (SCI)15. Mac...原创 2010-12-03 12:06:21 · 567 阅读 · 0 评论 -
有关国际会议3
3对AI领域的会议的评点The First Class:今天先谈谈AI里面tier-1的conferences, 其实基本上就是AI里面大家比较公认的topconference. 下面同分的按字母序排列.IJCAI (1+): AI最好的综合性会议, 1969年开始, 每两年开一次, 奇数年开. 因为AI实在太大, 所以虽然每届基本上能录100多篇(现在已经到200多篇了),但分到每个...原创 2010-12-03 12:00:22 · 336 阅读 · 0 评论 -
有关国际会议2
AREA: Artificial Intelligence and Related SubjectsRank 1:AAAI: American Association for AI National ConferenceCVPR: IEEE Conf on Comp Vision and Pattern RecognitionIJCAI: Intl Joint Conf on AIICCV: ...原创 2010-12-03 11:56:06 · 301 阅读 · 0 评论 -
有关国际会议1
1几个数据库/数据挖掘会议iamluckySIGMOD:98分,数据库的最好会议,也是最好的系统类的会议之一。已经有30年的历史。一般在美国开,加拿大开过两次。最近开始每隔几年在别的洲开一次。94年在巴黎,97年将在北京。现在能见到越来越多的第一作者是中国学生的SIGMOD paper。与VLDB/ICDE不同,它是double blind review的会议。 VLDB:95分,...原创 2010-12-03 11:53:53 · 135 阅读 · 0 评论 -
启发式算法简谈(一)
转载自http://blog.csdn.net/aris_zzy/archive/2006/05/27/757156.aspx 引言:解决实际的问题,要建模型,在求解。求解要选择算法,只有我们对各种算法的优缺点都很熟悉后才能根据实际问题选出有效的算法。但是对各种算法都了如指掌是不现实的,但多知道一些,会使你的选择集更大,找出最好算法的概率越大。现在研一,要开题了些点文献综述,愿与大家分...原创 2009-07-09 11:28:00 · 2193 阅读 · 0 评论 -
TF-IDFzz
在一份给定的文件里,词频 (term frequency, TF) 指的是某一个给定的词语在该文件中出现的次数。这个数字通常会被正规化,以防止它偏向长的文件。(同一个词语在长文件里可能会比短文件有更高的词频,而不管该词语重要与否。)对于在某一特定文件里的词语 ti 来说,它的重要性 可表示为: Tfi,j=ni,j/Σnk,j 以上式子中 ni,j是该词在文件dj中的出现次...原创 2009-07-06 11:50:00 · 109 阅读 · 0 评论 -
总结一下信息检索效果评价方法
1.准确率和覆盖率覆盖率。准确率。平均覆盖率。平均准确率。 精度和召回率wiki:http://en.wikipedia.org/wiki/Precision_and_recall 2.浏览距离 这个概念最早在张德的博士论文《万维网信息聚类研究》中看到。其目的是为了评价信息检索系统的易用性。 设有一个信息检索系统...2009-05-05 16:50:23 · 1812 阅读 · 0 评论 -
语言模型在信息检索中的应用
语言模型在信息检索中的应用 背景聂建云博士是加拿大蒙特利尔大学(University of Montreal, Canada)的教授,主要研究方向是信息检索,自然语言处理等。6日上午,聂博士接受邀请,为计算机学院做了一次报告,主题为Integrating Term Relationships into Language Models for Information Retrieval目...原创 2009-11-02 11:14:19 · 1044 阅读 · 0 评论 -
与tf*idf权重的关系
3.3.4与tf*idf权重的关系tf*idf权重计算策略在传统的检索模型如向量空间模型和概率检索模型中都起着十分关键的作用。但是直观地看,查询似然检索模型的文档排名函数即式似乎只与词频tf有关,好像并没有利用idf的信息,而idf权重因子在度量词项的全局区分能力上扮演着至关重要的角色。从以下的推导和讨论中我们将看到,基于查询似然的文档排名实际上整合了传统的tf*idf权重信息,这种整合正是通...原创 2009-10-19 20:27:55 · 211 阅读 · 0 评论 -
语言模型方法
2.4语言模型方法统计语言模型是关于某种语言所有语句或者其他语言单位的分布概率。也可以将统计语言模型看作是生成某种语言文本的统计模型。一般来说语言模型的研究任务是:已知文本序列中前面(i-1)个词汇,第i个词汇为单词w的可能性有多大?在大多数统计语言模型的应用比如语音识别、信息检索等研究中,一个句子的概率常常被分解为若干n-gram概率的乘积,也就是n元语言模型。我们假设S代表了某个长度为k的...原创 2009-10-19 15:35:07 · 102 阅读 · 0 评论 -
文本的情感分析研究
第六章文本的情感分析研究 6.1引言传统上的文本分类往往关注于把文本映射到给定的主题,如体育,经济,政治等[122]。然而,近些年来对文本非主题分析的兴趣不断增加,Biber[123]的工作把文本就其来源和体裁风格(style)的不同进行分类,如作者,出版社和母语背景等。在诸如web网页,新闻组和在线新闻数据库这样的在线文本中,有大量隐含的信息可以利用,而在这些可用的信息中,一种有用的...原创 2009-10-13 17:03:34 · 422 阅读 · 0 评论 -
随机行走(random walk)
第4章基于图的特征选择我们研究的目的是寻找更高效、更能帮助分类器、能更好理解数据集的特征选择技术。我们提出一种新的基于图的过滤型特征选择算法:基于图的多类别特征结合算法(GMS, Graph-based Multi-category Score Combination)。这一算法对数据集上的每个类构建一个词在这个图上通过马尔可夫链给每个词项算出一个评分,然后综合各个词项在各个类别的评分,得...原创 2009-10-10 11:36:20 · 2542 阅读 · 1 评论 -
半静态模型
做压缩算法前,最好还是先弄明白现有的主要算法实例的实现方法,看别人的代码其实是最好的学习过程。有关概率模型的知识是数据压缩的核心内容,你可以参考《数据压缩技术原理与范例》、《数据压缩原理与应用》等书籍上的相关介绍。抄一段我以前给网友的回复: 从原理上讲,任何压缩算法都是由两个基本步骤组成的: 1、选择特定的概率模型,统计符号的出现概率2、用特定的编码方法对符号进行编码...原创 2009-10-06 17:41:33 · 292 阅读 · 0 评论 -
句法分析
句法分析(syntactic parsing)的任务就是识别句子的句法结构(syntactic structure)。 线图分析法 概念:线图是一组节点(node)和边(edge)的集合 节点:对应着输入字符串中的字符间隔边:<起点.终点.标记> 其中标记为非终结符或终结符 问题: 如何从输入串开始,一步步...原创 2009-09-22 18:04:14 · 421 阅读 · 0 评论 -
HMM示例及Matlab计算
Alice 和Bob是好朋友,但是他们离得比较远,每天都是通过电话了解对方那天作了什么。Bob仅仅对三种活动感兴趣:公园散步,购物以及清理房间。他选择做什么事情只凭当天天气。Alice对于Bob所住的地方的天气情况并不了解,但是知道总的趋势。在Bob告诉Alice每天所做的事情基础上,Alice想要猜测Bob所在地的天气情况。 Alice认为天气的运行就像一个马尔可夫链。其有两个状态 “雨”...原创 2009-05-17 22:00:42 · 623 阅读 · 0 评论 -
隐马尔可夫模型中的Viterbi算法zz
这篇文章简单描述一下Viterbi算法——一年之前我听过它的名字,直到两周之前才花了一点时间研究了个皮毛,在这里做个简单检讨。先用一句话来简单描述一下:给出一个观测序列o1,o2,o3 …,我们希望找到观测序列背后的隐藏状态序列s1, s2, s3, …;Viterbi以它的发明者名字命名,正是这样一种由动态规划的方法来寻找出现概率最大的隐藏状态序列(被称为Viterbi路径)的算法。这...原创 2009-05-18 20:49:23 · 159 阅读 · 0 评论 -
谈谈BM25评分
1 什么是BM25 摘录一段wiki BM25 is a bag-of-words retrieval function that ranks a set of documents based on the query terms appearing in each document, regardless of the inter-relationship between ...原创 2009-07-04 14:18:19 · 258 阅读 · 0 评论 -
IEEE Intelligent Systems, ISSI\-2009\-09\-0121: Decision: major revision
这篇早该发出来,以识之。go on working……IEEE Intelligent Systems, ISSI\-2009\-09\-0121: Decision: major revision 06-Dec-2009 Dear Mr. Wang, Thank you for submitting manuscript, “Message Receiv...2009-12-23 15:29:25 · 365 阅读 · 0 评论 -
Minor revision required \- IEEE Intelligent Systems, ISSI\-2009\-09\-0121\.R1
旧历年去年腊月二十九发出的信件,到三十晚上猛然发现的。滑行了一番。 识之。 IEEE Intelligent Systems, ISSI-2009-09-0121.R1manuscript type: SI: Mar/Apr 2010 - Context-Aware Middleware"Message Receiver Determination in Multipl...2010-03-26 21:06:35 · 614 阅读 · 0 评论 -
从SCI他引看研究论文的质量----再从这里谈开去zz
从SCI他引看研究论文的质量----再从这里谈开去zz 本来手头任务很重,但突然想查查相关领域内的人的文章质量,怎么查?就从SCI他引入手吧!他引为什么重要?因为你发表的文章如果没有人重视并引用它,那就和垃圾是无疑的,事实上,90%以上的SCI文章都是这一类,可见真正的好文章是多么少。EI就不用说了,基本是99%的都是垃圾文章。这反过来也证明了当今社会,学术界是多么无聊,不做实质的东西...2010-03-26 20:59:25 · 276 阅读 · 0 评论 -
从语言模型“反推”的角度看查询扩展
6.2从语言模型“反推”的角度看查询扩展查询扩展就是根据实际出现的词项推断应该出现的词项,也就是从用户提交的查询推断出隐含在用户查询意图背后的其他词项,从而“揣摩”出用户真实的信息需求。启发式的查询扩展方法在实现扩展时,采用的是一种启发式的扩展词选取方法和权重修正策略,缺乏严格的数学推导和理论依据。为了在统计语言模型框架内实现查询扩展,有必要将用户真实的查询意图表示为查询语言模型(或叫信息需求...原创 2009-12-04 21:43:48 · 207 阅读 · 0 评论 -
MDL-based Tree Cut Model
A straightforward way for determining a cut of a tree is to collapse the nodes of less frequency into its parent node. However, the method is too heuristic for it relies much on manually tuned frequen...原创 2009-06-01 16:12:13 · 110 阅读 · 0 评论 -
ISI公布2008年度SCI收录期刊影响因子
ISI公布2008年度SCI收录期刊影响因子 2009年6月20日凌晨,ISI公布了最新的SCI影响因子,部分关于人工智能的期刊影响因子如下 ACM Computing Surveys9.920ACM Transactions on Computer Systems2.391AI Communications0.608AI Magazine0.69...2010-03-08 21:37:38 · 149 阅读 · 0 评论 -
语言模型
恩,首先说语言模型是一个集大成的东西。。。千万不要以为自己知道了一元语言模型后就OK了。。。 据我所知,语言模型到现在为止,发到SIGIR上的论文超过100篇。。。应用语言模型的论文不计其数。。。 随着统计和机器学习的繁荣给了很多计算机领域一个全新的生命。语言模型也是在这种背景下产生的。。。更严格地说,它属于probabilistic relevance model中query g...原创 2009-11-18 21:12:11 · 137 阅读 · 0 评论 -
关于调整华中科技大学期刊分类办法征求意见的通知
关于调整华中科技大学期刊分类办法征求意见的通知 各有关院系:自2008年学校确定实施期刊分类以来,我校论文质量明显提高。随着期刊的变化及科学研究进展的需要,在总结过去工作的基础上,为进一步体现质量导向,坚持学科分类指导的原则,经聘任委员会主任委员会研究决定,拟对《华中科技大学期刊分类办法》(校人[2008]28号)进行修订,对学术期刊分类进行调整。现将有关工作布置如下。一、关...原创 2012-02-21 11:06:41 · 1722 阅读 · 0 评论