一,信息检索的基本概念,评价,模型和算法:
1)模型、相关反馈、查询扩展;2)文本处理技术;3)文本分类和聚类技术(倾向性分析);4)信息过滤技术;5)信息组织和索引;6)并行和分布式检索
二,信息检索的应用:1)WEB检索;2)数字图书馆;3)多媒体检索
三,国际著名研究机构和代表人物
1)美国康奈尔大学Salton(1927-1995),现代信息检索的奠基人,SMART的完成人,第一任Salton奖得主,ACM Fellow
2)英国剑桥大学SparckJones (1935-2007),概率检索模型的提出者之一,NLP和IR中的先辈,曾获ACL终身成就奖和Salton奖
3)美国UMassCIIR W. B. Croft,ACM Fellow,基于统计语言建模IR模型的提出者和倡导者,和CMU共同开发了Lemur工具,Salton奖得主
4)英国Glasgow大学Rijsbergen,ACM Fellow,信息检索逻辑推理学派的提出者和倡导者
现在试图用量子物理的方法解决IR问题,Salton奖得主
5)英国微软剑桥研究院、伦敦城市大学Robertson,概率检索模型的倡导者,开发了OKAPI,Salton奖得主
6)美国CMU,美国UIUC,微软研究院,IBM研究院,Google研究院
7)一些活跃的华裔学者:加拿大蒙特利尔大学聂建云教授(跨语言检索,IR模型);
美国UIUC ChengxiangZhai博士(IR模型);美国CMU YimingYang教授(文本分类);
台湾中研院简立峰(号称“中文搜索”第一人,加入Google研究院)
8)国内一些相关研究机构:北京大学,复旦大学,清华大学,哈尔滨工业大学,中科院计算所,中科院软件所,中科院自动化所
四,重要会议
国际会议:SIGIR、ACL、WWW、SIGKDD,CIKM、ICML ,TREC,AIRS
国内会议:全国信息检索及内容安全学术会议(2年一届),全国计算语言学联合会议(2年一届)
五,重要期刊
国际:
ACM Transactions on Information Systems(TOIS)
ACM Transactions on Asian Language Information Processing(TALIP)
Information Processing & Management(IP&M)
Information Retrieval
国内:中文信息学报,情报学报
六,重要工具
Lemur:包含各种IR模型的实验平台,C++
SMART:向量空间模型工具, C编写
Weka:分类工具,Java编写
Lucene:开源检索工具,各种语言编写的版本
Larbin:采集工具,C++
Firtex:检索平台,C++,计算所开发
七,参考书籍及文献
Baeza-Yates, R. & B. Ribeiro-Neto. eds. Modern Information Retrieval. ACM Press, 1999 (国内有机械工业出版社出版的影印版和中文翻译版)
李国辉等著,信息的组织与检索,科学出版社,2003年
Witten, Ian et al. Managing Gigabytes. Orlando, FL: Morgan Kaufmann Publishers Incorporated, 1999
William Frakes& Ricardo Baeza-Yates, Information Retrieval Data Structures and Algorithms. PrenticeHall, 1992
Karen SparckJones& Peter Willet eds. Readings in Information Retrieval, Morgan Kaufmann, 1997
SIGIR Proceedings (since 1971,迄今举办26届)
本文转自Phinecos(洞庭散人)博客园博客,原文链接:http://www.cnblogs.com/phinecos/archive/2007/10/14/923782.html,如需转载请自行联系原作者
</div> </div>
<div class="more-toolbox">
<div class="left-toolbox">
<ul class="toolbox-list">
<li class="tool-item tool-active is-like "><a href="javascript:;"><svg class="icon" aria-hidden="true">
<use xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="#csdnc-thumbsup"></use>
</svg><span class="name">点赞</span>
<span class="count"></span>
</a></li>
<li class="tool-item tool-active is-collection "><a href="javascript:;" data-report-click="{"mod":"popu_824"}"><svg class="icon" aria-hidden="true">
<use xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="#icon-csdnc-Collection-G"></use>
</svg><span class="name">收藏</span></a></li>
<li class="tool-item tool-active is-share"><a href="javascript:;" data-report-click="{"mod":"1582594662_002"}"><svg class="icon" aria-hidden="true">
<use xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="#icon-csdnc-fenxiang"></use>
</svg>分享</a></li>
<!--打赏开始-->
<!--打赏结束-->
<li class="tool-item tool-more">
<a>
<svg t="1575545411852" class="icon" viewBox="0 0 1024 1024" version="1.1" xmlns="http://www.w3.org/2000/svg" p-id="5717" xmlns:xlink="http://www.w3.org/1999/xlink" width="200" height="200"><defs><style type="text/css"></style></defs><path d="M179.176 499.222m-113.245 0a113.245 113.245 0 1 0 226.49 0 113.245 113.245 0 1 0-226.49 0Z" p-id="5718"></path><path d="M509.684 499.222m-113.245 0a113.245 113.245 0 1 0 226.49 0 113.245 113.245 0 1 0-226.49 0Z" p-id="5719"></path><path d="M846.175 499.222m-113.245 0a113.245 113.245 0 1 0 226.49 0 113.245 113.245 0 1 0-226.49 0Z" p-id="5720"></path></svg>
</a>
<ul class="more-box">
<li class="item"><a class="article-report">文章举报</a></li>
</ul>
</li>
</ul>
</div>
</div>
<div class="person-messagebox">
<div class="left-message"><a href="https://blog.csdn.net/weixin_33949359">
<img src="https://profile.csdnimg.cn/6/8/F/3_weixin_33949359" class="avatar_pic" username="weixin_33949359">
<img src="https://g.csdnimg.cn/static/user-reg-year/1x/4.png" class="user-years">
</a></div>
<div class="middle-message">
<div class="title"><span class="tit"><a href="https://blog.csdn.net/weixin_33949359" data-report-click="{"mod":"popu_379"}" target="_blank">weixin_33949359</a></span>
</div>
<div class="text"><span>发布了131 篇原创文章</span> · <span>获赞 43</span> · <span>访问量 19万+</span></div>
</div>
<div class="right-message">
<a href="https://im.csdn.net/im/main.html?userName=weixin_33949359" target="_blank" class="btn btn-sm btn-red-hollow bt-button personal-letter">私信
</a>
<a class="btn btn-sm bt-button personal-watch" data-report-click="{"mod":"popu_379"}">关注</a>
</div>
</div>
</div>