特征权重的处理与最终排名

权重 互联网上的所有的数据只有两种,离散型和连续性的。连续性的可以计数的,例如外链数量、关键词出现次数等,这些因素的处理直接采用的是计数,但是由于有些数量或许是非常大的,必须取对数来降低影响,这里就有一个问题http://blog.sina.com.cn/s/blog_5dac285301010jpj.html就是数值较大时候,一旦取了对数会不会降低了影响,zero在这里说了大众点评网的关键词密度过高问题,这里其实是有很多问题,在一定度量上,无论是否取对,数量都是呈现正面效应的,只是起到的作用降低了,这就比如一个加速度问题,力变小了,加速度变小了,但是速度还在增加ing的。 对于离散型数据,一般采用布尔模型或者向量空间模型处理机制,更多的是一个指标的多个纬度,这里最重要的是如何把度大小加入到离散型数据中,是采用带权传递或者给与不同权重分配不一样的比例。不管怎么计算,最终的结果都会呈现出不可控制性,但指标变多时候,不可控制的因素将会大大增加,但是同时也更多范围内满足人们的匹配。 百度和谷歌最大的区别就在于指标的量上是不一样多的,谷歌多,因此所需要的处理能力强,但最终排名会更加的客观,匹配度更加宽广,百度的指标量少,就呈现出中间突出的的状态,这也是两者结果排序最大的差别。 讲了这么多一定有人不耐烦了,这有什么用处呢?我说这个作用太大了,举个最小的例子,很多人看不懂为何某个页面排名异常的好,怎么都思考不出来为何,其实这就是离散型变量的影响,离散型变量呈现的一个最大的特点增加了结果的随机性。 至于如何采用特征权重的处理问题,还有一个最重要的就是结合我们做seo的时候,很多时候她都可以指导我们,比如某个因素做得太好时候,由于会去对数,影响将会降低,我们把握好这个点就可以把工作效率在理论上提高10倍;她也可以帮我们解释很多问题,如根据se的精神,当一个网站原创的文章的不再收录时候,很多人不知道为何会出现这样的机制,亲你知道为何吗?

转载于:https://my.oschina.net/tyseo/blog/529482

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值