**信息检索:
是一门不断发展并和其他领域、技术不断融合的学科。
基于语言建模的的信息检索模型、基于机器学习的检索结果排序方式、检索结果的Snippet生成、聚类标签生成、XML检索、搜索广告、网页作弊等等。
信息检索information retrieval 简称IR
信息获取
信息检索是从 大规模 非结构化数据的集合中找出满足用户信息需求的资料的过程。
非结构化数据(通常是文本)
集合(通常保存在计算机上)
满足用户信息需求的资料(通常是文档)
信息检索规模的分类
- Web搜索——大规模
- 个人信息检索——小规模
- 企业、机构、特定领域的搜索——中等规模