推一把SEO的总结

2014-10-21

图片的代替属性ALT

意义:是搜索引擎可以信任的参考点;图片无法显示时,可代替图片的描述性语句;

写法:<img  src=123.jpg  alt=小狗在吃粮食>

注意:ALT描述语禁止多样式添加关键词;最佳的描述语是 主语+宾语+动词/形容词

 

黑帽:black  hat

使用作弊的方法,让网站排名短时间内高/收录多的做法,最典型的是群发留言增加外链;

链接锚文本:Achor  Text

作用:多个网页内有链接锚文本指向A网站,那么A网站的排名就会靠前;

 

Alexa:是一家发布世界网站排名的网站;评价网站访问量的一个指标;

做法:浏览器植入Alexa 插件,向Alexa 数据库反馈浏览器加载的网页,每三个月统计浏览量和排名;

缺点:对于流量低的站点,精确度不高(并不是每个人都安装Alexa 插件);对一般个人站点、企业站点、网 店等没有实际用途;

 

 

百度蜘蛛:Baiduspider

作用:百度用来抓取互联网网页/URL的一个自动程序;抓取后会暂存到数据库中,提供给用户搜索;

类型:不同的搜索有不同的蜘蛛去抓取;有以类型:

网页搜索(baiduspider)、无线(baiduspidermobile)、图片(baiduspiderimage)、视频(baiduspidervideo)

新闻(baiduspidernews)、商务(baiduspiderads)、百度搜藏(baiduspiderfavo)、百度联盟(baiduspidercpro)

如何判断是否冒充Baiduspider的抓取?

① Linux 平台 :使用host  ip 命令来反解ip 来判断,代码如下

$ host 123.125.66.120

120.66.125.123.in-addr.arpa domain name pointer

Baiduspider-123-125-66-120.crawl.baidu.com

host 119.63.195.254

254.195.63.119.in-addr.arpa domain name pointer

baiduMobaider-119-63-195-254.crawl.baidu.jp

② window / IBM OS/2 平台:使用 nslookup  ip 命令反解ip 来判断,方法如下

打开命令处理器 输入 nslookup xxxx.xxx.xxx.xxx( ip 地址就能解析ip

③ mac os 平台:使用dig 命令反解ip 来判断,方法如下

打开命令处理器 输入 dig xxxx.xxx.xxx.xxx( ip 地址就能解析ip

注意:baiduspider hostname 的格式命名为  *.baidu.com 或者 *.baidu.jp ,如果不是即为冒充

如果网站不想被baiduspider 访问,怎么办 ?方法如下:

可以利用robots.txt 文件完全禁止或者部分禁止baiduspider 访问网站;

 

常见的访问权限设置(标志置入网页内):

①不想蜘蛛追踪此网页链接和不传递链接的权重:

< meta name = robots.txt content =nofollow>

②不想蜘蛛追踪某一条特定链接:

 < a href =signin.php rel=nofollow> sign in</a>

③允许其它搜索引擎跟踪,但是防止百度跟踪网页的链接:

 < meta name =Baiduspider content =nofollow>

④防止所有搜索引擎显示网站的快照:

< meta name =robots content =noarchive>

⑤允许其它搜索引擎显示快照,但仅仅防止百度显示:

< meta name =Baduspider content = noarchive>

 

熟练掌握robots.txt 文件

什么是robots.txt 文件:放在网站根域下的一个robots.txt 纯文本文件,这个文件可以指定baiduspider 在这个网站的抓取范围,如果想baiduspider 完全抓取就不要建立robots.txt 文件;

样式为:http://www.baidu.com/robots.txt

注意:baiuspider 会首先访问 robots.txt 文件,然后根据robots.txt 给定的权限来确定访问的范围;

      如果其它网站链接了你robots.txt 文件中设置禁止访问的网页,这些禁止的网页仍然会出现在百度搜索结果中。但是你的这些网页不会被百度抓取、建立索引和显示,仅仅展示链接你禁止访问的网页的网站;

Robots.txt 文件用法举例:

 

权限范围

User-agent:

Disallow:

Allow:

禁止所有引擎访问

*

/


允许所有robot 访问

*


/

仅禁止百度蜘蛛访问

Baiduspider

/


仅允许百度蜘蛛访问

Baiduspider


/

*

/


禁止spider访问特定目录

*

/目录1/



/目录2/


允许访问特定目录中的部分URL

*

/目录3/

/目录1/子目录


/目录4/

/目录2/子目录

禁止访问目录1/2下的所有html 为后缀的URL

*

/目录1/*.htlm



/目录2/*.htlm


仅允许访问.html后缀的

*

/

/*html$

禁止访问网站动态网页

*

/*?*


允许抓取网页,禁止抓取任何图片

Baiduspider

/*jpg$



所有图片的格式


备注:

User-agent :该项的值用来描述搜索引擎robot 的名字

Disallow :描述不希望被访问的一组URL 

         Disallow: /help  --> 禁止访问:/helpl.html /helpabc.html  / help/index.html 

         Disallow:/help  --> 是允许/help.html  /helpabc.html  但是不能访问:/help/index.html

Allow :描述希望被访问的一组URL

URL 匹配举例:

Allow 或 Disallow 的值

URL

匹配结果

/tmp

/tmp

yes

/tmp

/tmp.html

yes

/tmp

/tmp/a.html

yes

/tmp

/tmphoho

no




/Hello*

/Hello.html

yes

/He*lo

/Hello,lolo

yes

/Heap*lo

/Hello,lolo

no

Html$

/tmpa.html

yes

/a.html$

/a.html

yes

Html$

/a.html

no

 

 

导入链接:Backlinks  = Inbound  Links  由其它网站指向你的网站的链接;

坏邻居:Bad  Neighborhood   你的网站所链接的网站质量低下 (容易被搜索引擎惩罚);

障眼法:Cloaking  是指一个网页制作两个版本(采用识别访问者身份的技术),让搜索引擎和浏览者看到不同的网页内容;是典型的SEO 作弊方法 ;

页存:Cache    是指百度蜘蛛将网站内容存储到他们的数据库,因为不定时的更新,存页内容可能会不同,一般情况在搜索结果下面有几个页存的链接;

竞价广告:CPC/PPC

转化:Conversion  从访客变为顾客的过程;

爬行:Crawl  对搜索引擎访问网站的形象说法; 从一个网站的链接爬行到别的网站;

网页样式表:CSS  全称Cascading  Style  Sheets  是指命令的一环扣一环的统一设定;

 

2014-10-22

DMOZ :也叫ODP(Open Directory Project开放目录工程;非赢利性官方站点:http://www.dmoz.org ;最有信用的目录站;

描述标签 :Description Tag   ||  不同的搜索引擎对待描述标签(Description Tag)的态度差别很大 ;百度没有实际用处,但多了会被怀疑作弊;google比没有好一点,但不要叠加很多;YahooMSN比没有好很多

桥页 :Doorway Pages  ||  如今搜索引擎能识别它,一旦发现,会封掉桥页及主域名;

动态页面 :Dynamic URL  ||  带有“?,这样的链接一般是动态链接;

动态页面特征:①以ASPPHPJSP等编程语言制作的;② 只有当用户请求时服务器才返回一个完整的网页;③ 动态页面上的内容存在于数据库中;⑤实现功能多,如用户注册、用户登录、在线调查等等;

SEOR看动态页面弊端:①网页内容主题不能保证永恒性; ②搜索引擎在判断和识别容易失误;③ 动态链接,无法确定这个页面会一直存在;

入口页 :Entry Page  ||  是访客进入你网站的那一页 ;任何一页都有可能是入口页;入口页的数量,可以用来衡量搜索引擎优化的效果;

出口页 :Exit Page  ||  出口页可以分析访客跑掉的原因;

谷歌爬行器 :Feedfetcher  ||  会定时地随着rss地址去找你的站点爬取feed 

佛罗里达更新 :Florida Update  ||  2003 11 月上旬Google 反击黑帽SEO对排名算法的更新;

刷新探测器 :Freshbot  ||   持续不断地发现新的内容,网站、论坛、博客等;

深度探测器 :Deepbot   ||  每月出击一次;

谷歌应用界面 :Google API  ||  编制的程序来索询网页;

HTTP状态码 :服务器想浏览器返回的一个代码以响应请求;

隐藏文字 :Hidden Text  ||  多余的文字隐蔽在HTML 页码之中只让搜索引擎看见或者使之透明而让浏览者看不见;这是一种过期的作弊手法;

内部链接 :Internal Links  ||  内部链接结构也能让有较高PR 值的网页把PR 值传递到其他网页;

 

索引 :作为名词,是指搜索引擎存储有价值的网站信息的收录数据库。||  作为动词,是指搜索引擎将网站访问后获取有价值的信息,给以存储,以便提供给搜索者。

 

 

 

 

 

 

 

 

 



转载于:https://my.oschina.net/newgoup/blog/535731

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值