写在之前的话: 排序写不下去了,再写下去就要涉及到一些数据结构和数学分析的话题了,尤其数学分析,是要花点时间学习下数学知识,暂且先记点数据结构的知识。
队列
队列实现了一种先进先出的策略,队列主要有两种操作:出队和入队,如图:
结构很简单,没什么好记的,记点队列的应用吧。
队列
队列实现了一种先进先出的策略,队列主要有两种操作:出队和入队,如图:
结构很简单,没什么好记的,记点队列的应用吧。
第一个应用是关于图的广度优先搜索,图的结构是由节点集合和边集合组成G(V,E),如图
就是由V1-V6以及他们之间的边组成的一个图,利用广度优先搜索算法遍历这个图的话,先将V1节点入队,起点就是从V1节点开始,将V1节点出队,访问V1节点,然后将与V1节点有边的顶点集合分别入队列,再依次出队顶点元素访问,对于访问过的节点需要标记以防止重复访问。广度的意思指的就是访问一个节点,然后访问与它相邻的节点,直至所有的节点被访问过。在栈的章节会记下深度优先搜索算法,也是比较容易的。
下面是一段爬虫的代码:利用广度优先搜索访问一个站点中的所有页面. def crawl
while @page_queue.length != 0 do
cur_link = @page_queue.pop
if @visited_page.include? cur_link or not check_valid_link(cur_link)
next
end
begin
current_page = @agent.get cur_link
fetch_content current_page, cur_link
fetch_links(current_page).each do |link|
@page_queue.push link.href
end
rescue
next
end
end
p @page_queue
end
完整的程序的功能是搜集一个站点中的所有QQ和Email,详见https://github.com/kimboqi/site-crawler
消息队列也是队列的一种应用,送进程将消息写入队列尾,接收进程则从队列头读取消息。
关于消息队列的一些介绍详见http://blog.csdn.net/kimboqi/article/details/7543292