第2次实验——算法基本功 与 综合思考

1.经典算法面试题(至少选择其中1道题并作答,有自己的思考与理解)

    收集一些top软件公司经典算法面试题(有很多公司的经典面试题,可供选择)

    白话经典算法序列(个人非常优秀的总结)

    ……

(1)1024! 末尾有多少个0?
末尾0的个数取决于乘法中因子2和5的个数。显然乘法中因子2的个数大于5的个数,所以我们只需统计因子5的个数。
是5的倍数的数有: 1024 / 5 = 204个
是25的倍数的数有:1024 / 25 = 40个
是125的倍数的数有:1024 / 125 = 8个
是625的倍数的数有:1024 / 625 = 1个
所以1024! 中总共有204+40+8+1=253个因子5。
也就是说1024! 末尾有253个0。

(2)有A、B、C、D四个人,要在夜里过一座桥。他们通过这座桥分别需要耗时1、2、5、10分钟,只有一支手电,并且同时最多只能两个人一起过桥。请问,如何安排,能够在17分钟内这四个人都过桥?
 
第一趟过去:两人:花1分钟和2分钟的人  //总共耗时:2分钟
第一趟过来:一人:花1分钟的人         //总共耗时:3分钟
第二趟过去:两人:花5分钟和10分钟的人 //总共耗时:13分钟
第二趟过来:一人:花2分钟的人         //总共耗时:15分钟
第三趟过去:两人:花1分钟和2分钟的人  //总共耗时:17分钟

2,算法综合实践——搜索引擎

    上网搜索有关“搜索引擎”的相关资料,包括但不限于以下方面(至少要有2个方面):搜索引擎岗位要求、搜索引擎工作原理、搜索引擎涉及到教材中哪些算法、搜索引擎的盈利模式、搜索引擎源码链接、国内外搜索引擎公司现状等。

答:搜索引擎的基本工作原理包括如下三个过程:首先在互联网中发现、搜集网页信息;同时对信息进行提取和组织建立索引库;再由检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。
1、抓取网页。每个独立的搜索引擎都有自己的网页抓取程序爬虫(spider)。爬虫Spider顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。
2、处理网页。搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索引。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。
3、提供检索服务。用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。

几个著名的搜索引擎
(1)AltaVista   (2)Yahoo  (3)Google  (4)CiteSeer
搜索引擎的分类
通用搜索引擎   专业搜索引擎    元搜索引擎


搜索引擎目前主要存在的问题
     现在的搜索引擎可谓“百花齐放”,Google、Yahoo、百度、天网等搜索引擎激烈竞争,连之前很少涉及搜索引擎领域的微软也按捺不住,推出了MSN搜索引擎。但是仍然有许多问题:
     (1)网络信息量太大,而且处于不断的更新当中,难以进行全面的收录,而且收录得越多,全面的更新越困难。
     (2)对于搜索引擎使用者的真正需求,程序并不能准确判断。同样的关键词,不同的人可能需要查找的内容不一样。要在返回查找结果的过程中,将所有结果按重要程度从高到低的顺序组织起来呈现给用户,排序算法是十分关键的。目前许多搜索引擎都使用基于关键字查询的传统的信息检索算法和技术,返回的页面数量仍然是成千上万。然而“据估计近85%的用户只浏览搜索引擎返回的第一页结果”因此,如何将用户最感兴趣、最重要的页面放在搜索结果的前面就成为影响搜索质量的一个重要因素。
     (3)现在越来越多的人为了能够在搜索引擎返回的结果中排位靠前,特别针对搜索引擎的算法进行一定的优化,如在网页中大量添加热门搜索词汇等,影响搜索引擎的正确判断,使得用户得到许多毫无用处的结果。
     (4)分词技术不完善,对中文的检索结果很多不能与用户期望的很好匹配。


  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值