算法相关
编程行者
2010年毕业于太原理工大学。先后任职于某外包公司、新城阳光(北京)科技有限公司。 目前任职于宠爱堡数字(北京)网络科技有限公司,担任技术经理一职。负责在线业务系统的研发、运维、架构设计、项目管理等相关的工作
展开
-
lucene 分词的一些杂谈
找遍了网上所有的中文的分词工具,没有一个可以拿来用的,所以决定还是自己做一个分词的工具把,分词的核心功能:1.分词基础算法(常见的有正向最大,逆向最大,最多分词,基于统计,基于理解即无词库分词等,当然一个好的搜索引擎必然是基于多种分词方式的)2.是否支持强制一元分词:这个是商业的搜索引擎必备的。3.同义词识别,简体中文和繁体中文的识别对应转换,中文和拼音的互转4.支持中文分词的时候是否考虑原创 2016-05-11 16:40:44 · 1244 阅读 · 0 评论 -
简单二叉树的实现
一个简单二叉树的实现,来自http://zhouyunan2010.iteye.com/blog/1255299package searcher.performance;import java.util.Iterator;import java.util.NoSuchElementException;public class BinarySortTree { private Ent原创 2016-05-11 16:40:28 · 457 阅读 · 0 评论 -
平衡二叉树的实现
来自http://zhouyunan2010.iteye.com/blog/1255303package com.utils;import java.util.Iterator;import java.util.NoSuchElementException;public class AVLTree { private Entryroot = null; private原创 2016-05-11 16:40:31 · 159 阅读 · 0 评论 -
PageRank概念
来源:http://wxsgdsgz-126-com.iteye.com/blog/1311968 PageRank是Google搜索算法中最为基础而核心的一种,通过将网络看做一个整体、网页间链接即投票等思想构建出了最初的排名机制,并使得Google击败当时的Yahoo搜索,成就了今天的地位。PageRank的实现包含了很多数学方法应用,要真正理解还是有难度的,这篇博客中,我只基于自己的理解原创 2016-05-11 16:40:34 · 746 阅读 · 0 评论 -
浅谈PageRank(公式1)
来源:http://wxsgdsgz-126-com.iteye.com/blog/1315093说实话,这篇博客写的真的很纠结~PageRank作为一个如此成功而强大的排序算法,内部现非常的复杂,在用矩阵进行数学建模后,又用到了迭代的思想使计算值趋于稳定,其中还涉及到了衰退因子、模型收敛等问题,我只能就着自己少量的线性代数知识对其进行简单的分析,梳理出我考虑PR实现思路,这里我的说明只是理论原创 2016-05-11 16:40:36 · 1066 阅读 · 0 评论 -
PageRank简单实现
可能最近发的pageRank等一些基础的东西比较多,最近想做一个文档的评分推荐引擎,但是没有那么大的创造力,只能是借鉴一些已经成熟的实现方案,从中寻找一些灵感。过一段时间可能会找一些距离算法,内容聚合的相关类博文。写原创需要很多的精力,本人太懒,总是把别人的东西贴过来,自己的代码也是公司成果也不敢乱发。本例子中的部分计算的数据有差错,本人并未做修改,直接拷贝过来了,后面的例子也改了一下。来源原创 2016-05-11 16:40:39 · 706 阅读 · 0 评论 -
lucene评分机制
原文出处:http://blog.chenlb.com/2009/08/lucene-scoring-architecture.htmlLucene 评分体系/机制(lucene scoring)是 Lucene出名的一核心部分。它对用户来说隐藏了很多复杂的细节,致使用户可以简单地使用lucene。但个人觉得:如果要根据自己的应用调节评分(或结构排序),十分有必须深入了解 lucene原创 2016-05-11 16:40:42 · 368 阅读 · 0 评论 -
lucene搜索结果排序
本文系转载,原文地址不详传统上,人们将信息检索系统返回结果的排序称为"相关排序"(relevance ranking),隐含其中各条目的顺序反映结果和查询的相关程度。1、基本排序原理①向量空间模型Gerald Salton 等在 30多年前提出的"向量空间模型" (Vector SpaceModel,VSM)[Salton and Lesk,1968,Salton,1971]原创 2016-05-11 16:40:47 · 895 阅读 · 0 评论