(1)信息检索是从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用户信息需求的资料的过程。
(2)信息检索已经代替传统的数据库式搜索成为信息访问的主要形式.
(3)信息检索也包括对半结构化数据类型(如网页,因含有标签)的处理。
(4)用户对文档的浏览、过滤或对返回的文档的进一步处理也属于信息检索的范畴,如聚类。
(5)信息检索按规模分为三类:Web搜索(如google),企业、机构和特定领域的搜索(如知网中的搜索),个人信息检索(如windows自带的搜索)。各种信息检索重点关注的问题有所不同。