微信小程序收录索引优化技巧

爬虫访问小程序内页面时,会携带特定的 user-agent “mpcrawler” 及场景值:1129

判断请求是否来源于官方搜索爬虫的方法:

签名算法与小程序消息推送接口的签名算法一致。

参数在请求的 header 里设置,分别是: X-WXApp-Crawler-Timestamp X-WXApp-Crawler-Nonce X-WXApp-Crawler-Signature

签名流程如下: 1.将token、X-WXApp-Crawler-Timestamp、X-WXApp-Crawler-Nonce三个参数进行字典序排序 2.将三个参数字符串拼接成一个字符串进行sha1加密 3.开发者获得加密后的字符串可与 X-WXApp-Crawler-Signature 对比,标识该请求来源于微信

1. 确保小程序里跳转的页面 (url) 可被直接打开。

小程序页面内的跳转 url 是爬虫发现页面的重要来源,且搜索引擎召回的结果页面 (url) 是必须能直接打开,不依赖上下文状态的。 特别的:建议页面所需的参数都包含在url里。

2. 页面跳转优先采用 navigator 组件。

小程序提供了两种页面路由方式:
a. navigator 组件
b. 路由 API,包括 navigateTo / redirectTo / switchTab / navigateBack / reLaunch 建议使用 navigator 组件,若不得不使用API,可在爬虫访问时屏蔽针对点击设置的时间锁或变量锁。

3. 清晰简洁的页面参数。

结构清晰、简洁、参数有含义的 querystring 对抓取以及后续的分析都有很大帮助,但是将 JSON 数据作为参数的方式是比较糟糕的实现。

4. 必要的时候才请求用户进行授权、登录、绑定手机号等。

建议在必须的时候才要求用户授权(比如阅读文章可以匿名,而发表评论需要留名)。

5. 微信小程序不收录 web-view 中的任何内容。

微信小程序暂时做不到收录 web-view 中内容,长期来看,可能也做不到。

6. 利用 sitemap 配置引导爬虫抓取,同时屏蔽无搜索价值的路径。

这一点上微信小程序和百度搜索的逻辑一致,同样需要通过sitemap来引导爬虫对内容进行抓取,同时需要把低质量的内容或者不需要呈现给用户搜索的内容对爬虫进行封禁。

7. 设置一个清晰的标题和页面缩略图。

页面标题和缩略图对于我们理解页面和提高曝光转化有重要的作用。 通过 wx.setNavigationBarTitle 或 自定义转发内容 onShareAppMessage 对页面的标题和缩略图设置,另外也为 video、audio 组件补齐 poster / poster-for-crawler 属性。

8. 使用页面路径推送能力

sitemap的效率相对较低,使用页面推送可极大丰富微信可以收录的内容,进而提高小程序内容的曝光机会。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值