一、标点符号的重要性
很多人忽略了标点符号对爬虫的重要性,爬虫并不是对所有标点符号都爬取,下面列举几个对关键字分隔有帮助的符号。
1.1、逗号( , ) ==> 千万千万要使用英文的逗号,而不是中文的逗号。英文逗号是作为词与词之间的分隔符,而中文逗号则不是分隔符,搜索引擎会把含有中文逗号的看作一个整体。 1.2、空格 ==> 空格在英文里面能起到分隔的作用,但是在中文并没有任何作用,中文的关键字优化就不要用空格了。 1.3、下划线( _ ) ==> 下划线也是在关键字优化里面经常用到的符号 1.4、短竖线( | ) ==> 短竖线也是在关键字优化里面经常用到的符号
以上是我所知道的对关键字能起到分隔的符号,其余的像 单引号(‘ ’),双引号(“ ”),顿号(、),破折号(——)这些并不会起到分隔作用。但是我建议是,如果一段句子真的要用到这些字符,建议也是使用英文的符号。像单引号,双引号可以用英文代替,而顿号,破折号只能是中文这个就没办法了。
二、对网站内部优化
2.1、title
title标签理解起来就是网站的标题,也是爬虫最先找的地方,是seo优化的一个三大标杆之一。标题的长度不超过80个字数。
2.2、description
description翻译为过来就是简介,也就是对网站的简要介绍,是seo优化的一个三大标杆之二。简介的长度不超过100个字数。
2.3、keyword
keyword就是所谓的关键字,是seo优化的一个三大标杆之三。你可以把相关的关键字都放到这里面来,keyword的长度不超过200字数。
2.4、img标签的alt
了解过seo都知道爬虫是不识别图片的,图片的话爬虫只认alt,所以在alt里面添加关键字,可以更好的勾引爬虫。
2.5、a标签的title
a标签也就是超链接,超链接本身的地址爬虫是无法识别的,因此title起到了超链接名字的作用。
2.6、Heading标签
顾名思义就是标签h1、h2、h3、h4、h5、h6,善用他们你会很好的吸引爬虫。但不是越多越好,一般3~5个之间。
2.7、对网站的关键词做适当修饰
加粗、下划线、strong标签、b标签、斜体都会有概率吸引到爬虫注意。一般文章的标题都是加粗的,这样其实也就相当做了修饰了。
三、网站外部的影响
友情链接
友情链接可以让网站获得权重,前提是该网站的权重本身就高。如没有权重的网站或者权重不高的话,对自己网站的权重影响不会太大。
第三方平台
可以发布文章到第三方网站上,例如:新浪微博,公众号,网易新闻,等。这些可以让自己网站有更高的曝光率。