搜索开发
相国
抱歉有些留言回复可能没看到,CS硕士,
文本挖掘、DM算法、Python数据、Java后端
展开
-
记录一次失败的Windows上milvus安装
milvus是一个向量近似搜索库,未来应该会在很多领域有大用途。最近一年才出的,所以想赶个时髦。但是milvus跨平台不是像Java语言这种方式,而是通过docker安装的形式。没玩过docker,好吧,正好也试试吧。在Windows上装docker,有两种选择:一个是官网推荐的docker for desktop, 适合win10专业版旗舰版教育版。但家庭版不支持,另一个就是docker toolbox。很多win10 home, win7, win8的系统都可以用。我是win10 ho...原创 2020-08-18 14:02:50 · 3029 阅读 · 5 评论 -
用elasticsearch和kibana 进行简单的实时数据报表分析
elasticsearch+kibana能帮助你轻松完成一个实时日志报表的功能。es需要制定自己的template, kibana要注意时区问题。原创 2016-01-26 15:31:21 · 24345 阅读 · 2 评论 -
利用Solr完成向量乘以矩阵功能:以协同过滤算法ItemCF为例
很多应用的计算最终都转化为矩阵相乘来完成,例如推荐算法中的协同过滤就可以套上去。协同过滤(collaborative filtering)是推荐系统中一类广泛使用的方法,协同过滤中两种比较出名的方法item-based CF、user-based CF。itemCF方法更简单,推荐理由也更温和,将是本文介绍的实践内容。原创 2014-06-01 13:05:54 · 3886 阅读 · 0 评论 -
Solr应用之电商商品搜索备忘
把以前做电商商品搜索的经验总结一下,原创 2014-10-16 16:15:18 · 4242 阅读 · 1 评论 -
配置Solr中文分词器IK以及ansj,支持动态修改用户词库。
经常看到不少人问solr的IK分词如何配置,如何实现中文动态词库添加这类问题,中文分词看来还是solr使用的一个容易卡住的地方。其实solr自带中文分词smartcn,它是个ictclas智能分词的java版。如果想体验一下smartcn的效果是比较简单的,配上对应的tokenizerFactory就可以了,但smartcn不支持动态增加词库。我们都知道一般词库都是单例,想动态修改词库要么保证原创 2013-11-01 16:16:15 · 8985 阅读 · 3 评论 -
elasticsearch学习入门
这几年,搜索的开发门槛越来越低,每个语言都有开源的检索工具包,而且功能越来越全,完整的解决方案也越来越多、越来越好用,比如lucene上就有solr, elasticsearch, sensei等。它们对于绝大部分的需求应该说都覆盖了,解放了直接在检索工具包上的开发工作量,让人可以更多关注业务上的开发。个人比较看好elasticsearch(简称ES),ES的使用非常简单,让人感觉更多地在使用原创 2012-10-09 20:04:08 · 14203 阅读 · 3 评论 -
搜索词纠错(拼写检查)、相关搜索的原理与实现
相关搜索是检索功能的一个扩展,用来告诉用户自己输入查询词的情况。如果输入错了,可能会纠错提示用户:“想找的是不是” 。另外还会在显著位置提供与输入查询词相关的其他查询词,例如百度结果页下面的提示, 而对于电商网站这两个功能会合在一起,下面分别说说我对这两个任务的理解。一、纠错功能,英文叫做spellcheck,在英文上做纠错比较直接,就是看单词的原创 2013-04-05 12:58:12 · 16731 阅读 · 0 评论 -
solr学习笔记(二):进阶
这次讲讲solr4.0最新的云,其中solrj那段引用了其他人的结论,以后可能还会调整一下内容。到1月23号已经更新了4.1,solrcloud改变不少,尤其是修复了一些bug, 4月最新版是4.3,也是增加了很多内容1. solrcloud jetty启动: wiki有教程; 实验遇到的问题:1. 在windows上不同jetty带起的solr实例注册原创 2013-01-15 16:41:02 · 5110 阅读 · 0 评论 -
自动补全(智能提示)原理与实现
自动补全,英文叫autocomplete,好像也叫智能提示,就是用户在输入框敲一个字符会弹出下拉列表提示候选词给用户,方便用户输入,提升用户体验。 网上多是JS如何实现,用ajax请求拿到数据就可以了,这里分享一下后台实现的一些思路。如果对性能和效果要求不高的话,可以直接在数据库中用like的方式去匹配候选词集合;或者在一个检索系统上也可以通过查询前缀原创 2013-04-17 21:46:52 · 19557 阅读 · 6 评论 -
solr学习笔记(一):入门
Solr是一个比较成熟和热门的搜索引擎解决方案,之前的博客也提到过。最近在学习搜索开发也查阅过solr的资料,相对elasticsearch来说资料更全,案例更多也更让人放心,我现在还没发做很细致的比较,但个人认为中小型搜索用solr可能会更合适,毕竟更成熟可靠一些。 介绍Solr的资料也有不少,比如书籍就有 Solr.3.Enterprise.Search.Server和Apache原创 2012-12-30 21:22:57 · 4396 阅读 · 0 评论