★ 网页的搜索主要分为两类:静态网页搜索和动态网页搜索。
✈ 静态网页搜索:是指网页的内容都是在.html(或htm)或.js中,并不需要从数据库服务器中读取后再显示出网页内容,简而言之,就是不涉及数据库存取的网页就算是静态网页。实现静态网页的站内搜索功能是比较简单的,因为只要搜索各网页的源文件与各网页所要使用到的文件就行了;
✈ 动态网页搜索:是指网页的内容需要存取数据库之后才能正确地显示出来;
✪ 提高网页被搜索到的几率 & 不被搜索网站找到或检索到
提高网页被搜索到的几率
1.付费解决,省力不省钱!;
2.关键字的设置,在<head></head>中添加如下代码
<meta name="keywords" content="..."> <!--在content中添加关键字-->
使用关键字的注意点
- 关键字尽量是简单、常见,但又不能到处都有,罕见又不能太特殊!
- keywords提供的网页关键词通常是为搜索引擎分类网页使用的;
- 可以为网页提供多个关键词,多个关键词应该使用空格分开;
- 不要给网页定义过多的关键词,最好保持在10个以下,过多的关键词,搜索引擎将忽略;
- 不要给网页定义与网页描述内容无关的关键词;
- 由于网页制作者滥用keywords(提供过多的关键词或者提供与网页无关的关键词),导致目前常用的搜索引擎降低了keywords的重要性。
不被搜索网站找到或检索到
1.设置robots.txt
a.针对整个网站中的所以网页,或是某个(或某些)文件夹下的所有网页不想被搜索引擎找到;
User-Agent:* ← 此处为 “*” 表示适用于所有的搜索引擎 Disallow:/ ← 此处为 “/” 表示适用于所有网页都不会被搜索
b.针对某个(或某些)文件夹下的所有网页不要被检索(把网络服务器中主页所在的文件夹当作根目录)
User-Agent:* Disallow:/floder1 ← 此处为 floder1、floder2都是文件夹名称,sub则是在floder2下的子文件夹的名称
Disallow:/floder2/sub1
robots.txt文件配置完成保存,然后将这个robots.txt上传到网站服务器中主页所在的文件夹中即可。
2.设置在meta标签
此方法是在<head></head>中添加如下语句实现的。
<meta name="robots" content="none,noindex,notfollow" />
关于meta robots搜索引起方式,参见“梦之都”的相关资料
3.测底有效的阻挡方法
前面提到通过robots.txt与<meta>标签中的设置来避免被搜索引擎找到,但是!如果搜索引擎不理会那两个设置直接对网页内容进行搜索与创建索引,则还是可以找到索要避免被找到的网站或网页。幸运的是,大多数知名搜索引擎并不会这样子“任性”,所以前面的两项设置还是有一定作用的。
解决办法a.使用密码
既然是少数人才可观看的网页,则设计成必须输入密码(或用户名与密码)后才可进入网站(或网页)应该是合理的。而且此方法可以彻底阻挡各种搜索引擎与类似工具的搜索,只是验证密码的程序不可放在网页中(否则搜索引擎与类似的工具不就找到了吗?或是网友查看源码也可以看到),因此必须设计成ASP或JSP等才可以;
解决方法b.网页编码
所谓对网页进行编码就是浏览者使用浏览器观看时才进行解码还原成一般的HTML代码,如此不仅搜索引擎与搜索工具无用武之地,而且因而能够一般的浏览者无法(或不容易)检查网页源码的真正内容!
参考资料:《全民搞网页——博客|个人站|网店|论坛》程秉辉