这个系列是检索检索的内容,一直对这些方法比较感兴趣,所以记录之。一开始是接触斯坦福的CS 276 / LING 286: Information Retrieval and Web Search。后来发现中科院的王斌教授也教授了这个课,对于英语差的人,中文肯定是首选。下面贴出这两门课程的网址:
斯坦福cs276 :http://www.stanford.edu/class/cs276/
中科院现代信息检索:http://ir.ict.ac.cn/~wangbin/ircourse/index.htm
下面进入正式的课程学习。
课程介绍主要是说明什么是信息检索?和为什么要学习信息检索?这两个问题。
1.什么是信息检索?
给定用户需求返回满足该需求信息的一门学科。通常涉及信息的获取、存储、组织和访问。
从大规模非结构化数据(通常是文本)的集合中找到满足用户信息需求的资料的过程。
“找对象”的学科,即定义并计算某种匹配“相似度”的学科。
1.1信息检索的应用主要是在搜索,情报处理,挖掘,内容安全,推荐,舆情分析等等。
1.2搜索系统:web搜索引擎,IBM waston问答系统……