- 博客(12)
- 资源 (1)
- 收藏
- 关注
原创 mongodb密码恢复
呵呵,忘记mongodb 数据库 密码不用愁,用一下命令就能恢复mongo –port 27017 ace –eval “db.admin.find().forEach(printjson);”备注:-port :mongodb 的端口号ace: 为恢复的数据库名字
2013-10-17 10:06:42
1288
原创 TF-IDF java实现
最近在学习推荐系统,在文本分类中要得到特征词,首先要获取tf-idf模型,搜索中也会用到tf-idf,有必要深入学习。首先来简单回顾一下tf-idf.词频(TF)=某个词在文章中出现的次数词频(TF)=某个词在文章中出现的次数/文章的总词数或者:词频(TF)=某个词在文章中出现的次数/该文出现次数最多的词的出现次数TF-IDF:TF-IDF=词频(T
2013-10-15 09:37:08
4256
原创 redis实现搜索排行榜后记
记得以前写过一篇文章redis实现搜索排行榜,今天在测试redis的时候,发现了其中的一处bug。我们再统计搜索排行榜的时候,用jedis.zrevrange()方法是不能按照score降序排列得到结果Set set=jedis.zrevrange("sort", 0, 6);应该用zrevrangeWithScores(String key,long start,lo
2013-10-11 09:15:14
2924
原创 朴素贝叶斯文本分类算法java实现(二)
接着上一篇文章:朴素贝叶斯文本分类算法java实现(一),最近一直在学习朴素贝叶斯进行文本自动分类。为了加深理解,自己实现了多项式朴素贝叶斯对文本的自动分类。文本样本采用了搜狗提供的文本分类语料库.相关程序已经放在github上:https://github.com/awnuxkjy/naive-bayesianNaiveBayesMain:主函数类DefaultSto
2013-09-24 07:57:39
2286
2
原创 朴素贝叶斯文本分类算法java实现
在学习了朴素贝叶斯的概念后,下来我们来看看它的java实现。有一个网友已经实现了其java的算法,具体详见:数据挖掘-基于贝叶斯算法及KNN算法的newsgroup18828文本分类器的JAVA实现(上)Newsgroup18828文本分类器、文本聚类器、关联分析频繁模式挖掘算法的Java实现工程下载及运行FAQ主要思路:利用google的Newsgroup18828文
2013-09-22 12:18:21
4740
1
原创 elasticsearch 查询内容精确匹配
在实际应用中,我们需要查询内容要完全匹配其内容。其实很简单。在查询内容前面加上双引号。例如String q="\""+"俄罗斯空军"+"\"";//q为要查询的数据QueryStringQueryBuilder queryBuilder = new QueryStringQueryBuilder(q); //analyzer
2013-08-18 08:41:04
5651
原创 elasticsearch 0.19.9升级到0.90.1实录
最近,我把公司的搜索集群升级了一下,elasticsearch 版本0.19.9升级到0.90.1版本。现在来说说步骤:1.确保索引服务器的索引数据添加到elasticsearch集群中(我们采用定时任务把索引数据添加到elasticsearch集群中)。2.停止索引服务器的运行。3.在浏览器中运行http://ipaddress:9200/_flush,这样确保索引数据能保存到硬盘中
2013-06-12 09:19:18
876
转载 elasticsearch获取java client实例
转载自:elasticsearch获取java client实例一般情况下,我们可以用如下方法获取一个java client。public Client getTransportClient(){ // 设置client.transport.sniff为true来使客户端去嗅探整个集群的状态,把集群中其它机器的ip地址加到客户端中, // 这
2013-05-22 17:28:40
3218
1
转载 Index.ANALYZED in lucene4 is deprecated
在lucene4中使用Index.ANALYZED提示 is deprecated (过期) ,在Lucene4中用FieldType来实现。在IndexableFieldType类中/** * True if this field's value should be analyzed by the * {@link Analyzer}. * * This has
2013-05-13 18:00:42
629
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人