(3)算法综合实践——搜索引擎
工作原理:
搜索引擎的基本工作原理包括如下三个过程:首先在互联网中发现、搜集网页信息;同时对信息进行提取和组织建立索引库;再由检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。
1、抓取网页。每个独立的搜索引擎都有自己的网页抓取程序爬虫(spider)。爬虫Spider顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。
2、处理网页。搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索引。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。
3、提供检索服务。用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。
搜索引擎的盈利模式:
第一类: 左侧排名
客户为用户的每次点击搜索付钱。页面的左右两边都推出竞价服务,搜索次序是竞价结果优先。国内主要采用对象:百度和雅虎中国
第二类:右侧排名
搜索出来的结果是,左边为真实的搜索结果,从不进行竞价排名,可以保证用户的体验和需要的搜索结果。搜索页面的右边为盈利模式,采用固定排名。国内主要采用对象:Google
第三类:按时间计费
客户为某个时间段、某个时期的搜索结果显示付钱,有可能会附带竞价排名和固定排名。国内主要采用对象:门户网站
第四类:中文网址
在网民的电脑上安装地址栏搜索插件,在搜索结果页面的左边是竞价的搜索词汇。国内主要采用对象:3721和通用网址
(4)实习与工作
网页设计师:
1、熟悉网站建设的流程,具备独立进行网站项目的整体版式、风格设计能力。
2、熟练掌握DIV+CSS的运用与制作,熟悉各种浏览器兼容性调整(至少3种浏览器ie6、ie7、ff);熟悉HTML/CSS/Javaerror等并能熟练手工编辑修改HTML源代码。
3、具有良好的美术功底以及良好的创意构思能力,对色彩敏感,具有把握不同风格页面的良好能力。
4、有良好的组织观念和团队合作精神、敬业精神,工作积极主动,细致专注,能承受工作压力。
5、会flash动画设计.
职位要求:
1)有自信,学习能力强。男女不限,两年以上网页设计经验;
2)对大型网站的页面设计有独到见解,简历请附成功案例;
3)熟悉Photoshop,Dreamwaver、Firework、Flash等网页制作软件,熟悉Flash As;熟悉HTML,javascript,div+CSS,web2.0等Web标准;
4)对所从事的事业有热情,对行业相关的新技术有相应的敏感度,善沟通及能吃苦耐劳者优先;
5)有创意,能独立完成网站的策划制作,了解网页设计的细节知识,对互联网有深刻的认识;
6)有大型网站工作经验者优先。