1.robots协议缺失
作用:告诉搜索引擎哪些页面可以抓取
详情:
User-Agent: *
Allow: /允许
Disallow: 禁
Sitemap:文件地址
2.sitemap缺失地图
创建sitemap.xml文件的目的是为了方便搜索引擎的抓取,从而提高工作效率。生成sitemap.xml文件后,将链接放入robort.txt文件。
作用;提升抓取效率,提升收录时间
详情:建议自动生成网站地图
<?xml version="1.0" encoding="UTF-8"?><loc>文章网址</loc>
<priority>1.00</priority>
<lastmod>2022-05-28</lastmod>
<changefreq>always</changefreq>
URL里特殊符号的写法
解决方法一:
把实体引用编码后使用,即
把“&” 编码为 “&”
把“<” 编码为“<”
把“>” 编码为 “>”
把“‘” 编码为 “'”
把““” 编码为 “””
针对本文上面的问题,即把原来代码中的:
http://so.urkeji.com/?q=%BB%FA%C6%B1&c=web
替换为:
http://so.urkeji.com/?q=%BB%FA%C6%B1&c=web
解决方法二:
在标记CDATA中,所有的标记、实体引用都被忽略,而被“xml解析器”一视同仁地当做原始字符数据看待,CDATA的形式如下:<![CDATA[文本内容]]>
针对本文上面的问题,即把原来代码中的:
http://so.urkeji.com/?q=%BB%FA%C6%B1&c=web
替换为:
<![CDATA[http://so.urkeji.com/?q=%BB%FA%C6%B1&c=web]]>
使用CDATA需要注意的两点,一:由于CDATA的结束符号是“]]>”,所以CDATA中不能包含“]]>”,二:由于CDATA中的所有标记、实体引用都被忽略,所以CDATA不能嵌套使用。
3.alt和Nofollow标签缺失
Nofollow标签,它常用于A标签的一个属性值,主要表达不要向某个特定链接传递权重,有的时候写在Meta标签中,则表示不要爬行网页上所有的链接,主要的表现形式为:
① <a rel="nofollow" href="">不要跟随链接</a>
② <meta name="robots" content="nofollow"/>
影响;搜索引擎抓取识别
建议;给部分缺失标签添加有利于网站收录
一般只有在img标签上加alt属性
Nofollow
4.tdk完善
作用:利于网站权重的提升
1. <title>30个字内</title>
title设置应该包含用户的需求点同时还要具有吸引力,且长度要合理,title包含的关键词不宜太多,最好3个之内,太多容易导致权重分散,不利于排名。
2. <meta name="description" content="">
deion在做到详尽的情况下,更加突出公司或者主营的服务,描述标签包含的关键词最好5个之内,如果网站做了竞价,最好在描述标签里显示网站联系方式,这样许多用户看到信息就会直接拨打电话询问,提高转化率的同时还能节约成本。
3. <meta name="keywords" content=""> 3-5个关键词
keywords标签的要做到简洁明了,多个关键词之间使用“,”隔开,关键词设置在3个之内为佳,网站发展到权重比较高以后,可以增加到5个左右。
5.网站http://没有重定向到https://
内容
作用;提升网站安全性
详情;网站申请和部署证书
添加301重定向到https
6.目标网页大小过大
影响;网站页面加载速度
解决文案: 图片压缩 ,图片的格式都需按各自特性去存储