![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
rank
sdfjlkjsdfsaldfsdf
safasfds
展开
-
ITEYE博文抄袭检查
rank是一个seo工具,用于分析网站的搜索引擎收录排名。 比如我写了一篇文章:“使用Java8实现自己的个性化搜索引擎”,我想知道有哪些网站转载了我的文章,我该怎么办呢?请看这里,ITEYE博文抄袭检查的代码:https://github.com/ysc/rank/blob/master/src/main/java/org/seo/rank/impl/BaiduCopyChecke...2015-04-06 02:10:10 · 1745 阅读 · 0 评论 -
OSCHINA博文抄袭检查
rank是一个seo工具,用于分析网站的搜索引擎收录排名。 比如我写了一篇文章:“使用Java8实现自己的个性化搜索引擎”,我想知道有哪些网站转载了我的文章,我该怎么办呢?请看这里,OSCHINA博文抄袭检查的代码:https://github.com/ysc/rank/blob/master/src/main/java/org/seo/rank/impl/BaiduCopyChecke...2015-04-09 03:46:32 · 7204 阅读 · 0 评论 -
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法,对于其他的用户生成内容站点类型也具有同样的适用性。 最近在ITEYE博客频道上面出现了一种新型的商业广告形式,方法如下: 1、注册多个账号(一般10个以上)。 2、从多个账号中选择一个账号,发表1-2篇博文。 3、用剩下的账号顶2中发表的文章,这样这些文章在发表后的一天内几乎始终位于...2015-04-10 02:49:50 · 264 阅读 · 0 评论 -
一种通用的网页相似度检测算法
如果我们需要在海量的结构未知的网页库中找到和指定的网页相似度比较高的一些网页,我们该怎么办呢?本文提出的“一种通用的网页相似度检测算法”就是专门解决这个问题。 算法如下: 1、提取网页文本。这个提取步骤不要求精确,也没办法精确,因为你面对的是未知结构的网页,所以只需要提取去掉标签之后的文本即可。 2、对提取的文本进行分词。我们使用开源的中文分词组件word分词。...2015-04-10 08:43:18 · 1174 阅读 · 0 评论 -
100offer举办的「寻找实干和坚持的技术力量」开源项目投票排名分析程序
由于100offer举办的「寻找实干和坚持的技术力量」开源项目投票活动没有按照票数排序的功能,所以本文写了个小程序来实现这个功能,代码如下:import org.jsoup.Jsoup;import org.jsoup.nodes.Element;import java.net.URL;import java.util.HashMap;import java.util.M...2015-09-26 17:55:22 · 1291 阅读 · 0 评论