网页隐藏内容如何可见_如何彻底禁止搜索引擎收录指定网页内容

dfa7d7f45159be0ef48b0d2f53f509a6.png

前言

在《网站 robots.txt 文件配置方法》中我们介绍了如何使用 robots.txt 文件来禁止搜索引擎的蜘蛛抓取网站内容的方法。

但是该方法也并非对所有搜索引擎都有效,而且也有实现不了的效果,比如禁止传递链接权重、禁止快照等。

本文就介绍下如何使用 meta 标签完全禁止搜索引擎收录和索引网站的指定内容

meta 标签使用方法

meta 标签(漫游器元标记)是网页 HTML 语言标记的一种,可以让我们更精确地控制网页如何被编入搜索引擎的索引并在搜索引擎结果中显示。

# 使用方法

将编辑好的 meta 标签放在目标网页的 <head> 部分即可,示例如下:

<!DOCTYPE html>
<html>
  <head>
    <meta name="robots" content="nofollow">
    <meta name="googlebot" content="noindex, nofollow">
    ……
  </head>
  <body>……</body>
</html>

其中:

  • name:指生效的目标抓取工具(网络蜘蛛),robots 表示全部蜘蛛,也可以指定单个蜘蛛,如 Googlebot;
  • content:操作效果,noindex 表示不收入索引。

指令和效果说明:(↓截图自 Google Developers)

f1ca6b1103e3ec0812d826d28d3a8bcf.png

# 常用代码示例

1、禁止所有搜索引擎的收录和索引,也不追踪网页上的链接,

<meta name="robots" content="noindex, nofollow">

2、只禁止谷歌和百度蜘蛛的收录和索引,

<meta name="googlebot" content="noindex">
<meta name="baiduspider" content="noindex">

3、允许搜索引擎收录,但不追踪网页上的链接,也不传递链接权重,

<meta name="robots" content="nofollow">

4、允许搜索引擎收录,但禁止显示网页快照,

<meta name="robots" content="noarchive">

5、允许搜索引擎收录,但禁止索引网页上的图片,

<meta name="robots" content="noimageindex">

现在很多 SEO 插件,如 WordPress 的 Yoast SEO 等都支持在文章编辑页面直接设置索引方式,非常方便。

5a233427b5186ece4817cc565d5fe71e.png

结语

在网页的 <head> 标签中插入好 meta 标签后,并不会立即生效,需要等到下一次搜索引擎抓取该网页时才会更新状态。

对于常见的 WordPress、Typecho 等博客,通常使用如 header.php 等模版统一生成 <head> 标签,会对全部文章都生效,需要格外注意。最好使用插件对单篇文章进行设置。

参考资料:

  • 漫游器元标记和 X-Robots-Tag HTTP 标头规范 | 搜索 | Google Developers
  • 禁止搜索引擎收录的方法 搜索学院 百度搜索资源平台
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值