前言:
你能说出搜索引擎工作原理是怎样的吗 ?
在搜索引擎网站的后台会有一个非常庞大的数据库,里面存储了海量的关键词,每个关键词又对应着很多的网址,这些网址被称为搜索引擎蜘蛛 / 网络爬虫。一个关键词对应多个网址,因此就出现了排序的问题,相应的 与关键词最稳合的网址会排在最前面。
在蜘蛛抓取网页提取关键字的过程中,存在一个问题。如果网站是 flash 和 js 等,它看不懂。相应的如果网站内容可以被搜索引擎识别,搜索引擎就会 提高该网站的权重,增加对该网站的友好度,这样一个过程称之为 SEO。
怎么实现前端 SEO 规范(简洁版)?
- 合理的 title,description,keywords,搜索对着三项权重逐个减少。title 强调重点即可,description 把页面内容高度的概括,keywords 列举出重要的 关键字。
- 语义化的 HTML 标签。
- 非装饰性的图片必须加 alt。
- 让重要的内容放在 HTML 最前面,优先加载,搜索引擎爬取 HTML 顺序从上往下,保证重要内容一定被抓取。
- 每个页面只出现一个 h1 标签。
- 少用 iframe,抓取不到。
- 页面扁平,层级太深不利于抓取。
- 异步加载内容(ajax)搜索引擎也无法抓取,重要信息选择直接输出,有利于用户体验和 SEO。
- 采用 友情链接:在别人网站导入自己网站的链接。
- 向各大搜索引擎登录入口提交尚未收录站点。
- 提高网站速度,网站速度是搜索引擎排序的一个重要指标。
怎么实现前端 SEO 规范(详细版)?
- 网站结构布局优化,尽量简单,提倡扁平化结构:
- 控制首页链接数量。
- 扁平化的目录层级:尽量让蜘蛛,只要跳转三次,就可以到达网站内的任一内页。
- 导航优化:导航尽量使用文字方式,图片要加上 alt 和 title。还应该加上面包屑导航。
- 网站的结构布局,页面头部,页面底部。
- 利用布局,把重要内容 HTML 代码放在前面。
- 控制页面的大小,减少 http 请求,提高网站的加载速度。
- 网页代码优化:
- 突出重要内容,合理的设计 title,description,keywords 等。
- 语义化书写 HTML 代码,符合 W3C 标准。
- a标签要加,title 属性加以说明。
- 正文标题用 h1,一个页面保证一个 h1。
- img标签要加,alt 属性加以说明。
- 表格应该使用 caption 表格标题属性。
- strong,em 标签的使用。
- 重要内容不要用 JS 输出。
- 尽量少使用 iframe 框架。
- 搜索引擎会过滤掉 display:none;其中的内容。
- 蜘蛛只能爬取 a 标签中的 href,不会执行 JS,只能抓到 get 请求的页面,不能抓到 post 请求的页面。