搭建利于SEO的web

1. 蜘蛛的抓取规则

1.1 只会抓取<a>的href部分

1.2 不会抓取javascript,  也就是不会抓取onclick, 如果<a href="javascript:void(0)" onlick="fun(1);return false;" >a</a> ,蜘蛛是不会执行fun(1)的,蜘蛛只关心href内容, 但是href中却是javascript:void(0); 所以不会执行.

1.3 只会抓取get方式请求的href地址, 不会抓post的href地址, 即href目标地址要允许get请求才行

1.4 虽然有很多帖子说爬虫不会抓动态地址,需要先把地址重写URL, 才会被爬虫抓取. 这点其实不可确定. google很早就申明动态url不会影响爬虫. 回头想想, 有如此多的网站在线上, 不是所有网站技术人员都懂得重写url的. 再说有那么多早期的网站, 如果重写url,岂不是要基本重做了? 如果不重做. 爬虫就抓不到这些网站的信息了? 这明显是不可能的 . 只能说重写url让链接更加标准化,简洁化. 如果是重建项目,或者新项目,不妨重写url.

1.5 通过robots.txt(robots.txt是爬虫访问网站的第一个文件)告诉爬虫哪些哪些规则可以抓,哪些不能抓. (一般前台页面才让抓, 后台管理页面不让抓)


2. 什么是重写url?

2.1 重写URL,就是把带一堆参数的地址,变成规矩的url.

如 http://www.domain.com/a.do?p=1000&v=1001 变成http://www.domain.com/a/1000/1001.do 

2.2 重写url其实就是一个过滤器,把原url转换成我们需要的url. java中也有多种方式实现重写URL, 这里不详写.


3. 如何既能用ajax, 又能SEO?

2.1 如<a href="http://www.domain.com/a.do" οnclick="fun(1);return false;">a</a>

2.1.1 页面依旧是通过fun(1)实现ajax. 并且通过return false告诉浏览器不执行href的内容

2.1.2 这里的href只是用于给爬虫抓取数据


4. robots.txt 基本语法及注意事项

4.1  User-agent:*  针对所有爬虫设置规则

4.2  Allow Disallow允许访问资源与不允许访问资源. 

#把所有图片都列为不允许抓取

Disallow:.jpg$
Disallow:.jpeg$
Disallow:.gif$
Disallow:.png$
Disallow:.bmp$

#只允许抓取的目录

Allow:/site/
Allow:/wap/

注意: Allow和Disallow的顺序. 爬虫引擎只根据第一个匹配成功的Allow,Disallow来确定是否抓取

4.3 通配符

4.3.1 * 表示一个或多个字母的通配符, 比如 Disallow:/testDir/*.html

4.3.2 $表示结尾,如  Disallow:.html$ 表示所有以.html结尾的文件


5. 页面的keywords和description

5.1 现在的爬虫引擎越来越聪明, 已经慢慢淡化了keywords和description的重要性. 而是根据网页内容自动提取. 因此内容是关键,而不是依赖关键字和描述.

5.2 所以建议只需要花一点时间去填写keywords和description即可.不要奢望靠这两个能得到很好的seo排名

5.3 据说大神的网站都是没有这两个meta的.不知道真的假的, 不过还是稍微写写吧

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Nuxt.js是一个基于Vue.js的服务端渲染框架,它具有一些优点和缺点。优点之一是它有利于SEO,因为网站通过href的URL将搜索引擎的爬虫直接引导到服务端,服务端提供优质的网页内容给爬虫。这意味着搜索引擎可以更好地索引和理解你的网站内容,从而提高网站在搜索结果中的排名。\[2\] 然而,Nuxt.js也有一些缺点。一个缺点是,服务端渲染需要在客户端和服务端之间进行代码的修改,这可能会导致开发效率较低,并且不利于系统的稳定性。因为在服务端渲染中,需要同时处理客户端和服务端的逻辑,这可能会增加开发的复杂性和维护的难度。\[2\] 如果你对Nuxt.js的SEO方面有疑问,你可以通过使用Nuxt.js的一些特性来优化你的网站的SEO。例如,你可以使用Nuxt.js提供的动态路由和异步数据方法来生成动态的页面内容,这有助于提高搜索引擎对你的网站的索引能力。此外,你还可以使用Nuxt.js的一些插件和配置来优化你的网站的SEO设置。\[1\] 总的来说,虽然Nuxt.js在一定程度上有利于SEO,但它也有一些缺点。在使用Nuxt.js时,你可以根据你的需求和优化目标来权衡利弊,并选择合适的解决方案。如果你对SEO非常重要,你可以考虑使用其他更专注于SEO的解决方案。\[3\] #### 引用[.reference_title] - *1* *2* [SEO 页面渲染 以及Nuxt.js的运用](https://blog.csdn.net/wptalenter/article/details/106236695)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [关于vue项目seo问题及解决方案](https://blog.csdn.net/kikikiuu/article/details/105108508)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值