noindex可以禁止搜索引擎收录某个网页,不禁止爬行、只禁止收录。
<meta> 标记
1.在该网页的 <head>
部分中添加:
<meta name="robots" content="noindex">
可以禁止大多数浏览器索引这个网页。
2.在该网页的 <head>
部分中添加:
<meta name="googlebot" content="noindex">
可以阻止 Google 网页抓取工具将网页编入索引。
HTTP 响应标头
除了使用元标记,还可在响应中返回一个值为 noindex
或 none
的 X-Robots-Tag
标头。响应标头可用于非 HTML 资源,例如 PDF、视频文件和图片文件。下面是一个 HTTP 响应示例,它含有一个 X-Robots-Tag
,用来指示抓取工具不要将某一网页编入索引:
HTTP/1.1 200 OK (…) X-Robots-Tag: noindex (…)