!DOCTYPE是文档说明,做一个兼容性的网页一般完整的文档说明如下:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
html 是标签
lang=”zh-cn” 属性说明这个html内容是以中文为显示和阅读基础。
meta charset 为网页提供了一种编码方式,否则页面很可能出现乱码。
UTF-8 是没有国家的编码,也就是独立于任何一种语言,任何语言都可以使用。
<meta name="robots" content="all">
有时候会有一些站点内容,不希望被ROBOTS抓取而公开。为了解决这个问题,ROBOTS开发界提供了两个办法:
- robots.txt
The Robots META标签
<meta name="Robots" contect="all|none|index|noindex|follow|nofollow">
默认是all
其中的属性说明如下:- 设定为all:文件将被检索,且页面上的链接可以被查询;
- 设定为none:文件将不被检索,且页面上的链接不可以被查询;
- 设定为index:文件将被检索;
- 设定为follow:页面上的链接可以被查询;
- 设定为noindex:文件将不被检索,但页面上的链接可以被查询;
- 设定为nofollow:文件将不被检索,页面上的链接可以被查询。