自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (1)
  • 收藏
  • 关注

原创 mongodb密码恢复

呵呵,忘记mongodb 数据库 密码不用愁,用一下命令就能恢复mongo –port 27017 ace –eval “db.admin.find().forEach(print​json);”备注:-port :mongodb 的端口号ace: 为恢复的数据库名字

2013-10-17 10:06:42 1288

原创 TF-IDF java实现

最近在学习推荐系统,在文本分类中要得到特征词,首先要获取tf-idf模型,搜索中也会用到tf-idf,有必要深入学习。首先来简单回顾一下tf-idf.词频(TF)=某个词在文章中出现的次数词频(TF)=某个词在文章中出现的次数/文章的总词数或者:词频(TF)=某个词在文章中出现的次数/该文出现次数最多的词的出现次数TF-IDF:TF-IDF=词频(T

2013-10-15 09:37:08 4256

原创 redis实现搜索排行榜后记

记得以前写过一篇文章redis实现搜索排行榜,今天在测试redis的时候,发现了其中的一处bug。我们再统计搜索排行榜的时候,用jedis.zrevrange()方法是不能按照score降序排列得到结果Set set=jedis.zrevrange("sort", 0, 6);应该用zrevrangeWithScores(String key,long start,lo

2013-10-11 09:15:14 2924

原创 朴素贝叶斯文本分类算法java实现(二)

接着上一篇文章:朴素贝叶斯文本分类算法java实现(一),最近一直在学习朴素贝叶斯进行文本自动分类。为了加深理解,自己实现了多项式朴素贝叶斯对文本的自动分类。文本样本采用了搜狗提供的文本分类语料库.相关程序已经放在github上:https://github.com/awnuxkjy/naive-bayesianNaiveBayesMain:主函数类DefaultSto

2013-09-24 07:57:39 2286 2

原创 朴素贝叶斯文本分类算法java实现

在学习了朴素贝叶斯的概念后,下来我们来看看它的java实现。有一个网友已经实现了其java的算法,具体详见:数据挖掘-基于贝叶斯算法及KNN算法的newsgroup18828文本分类器的JAVA实现(上)Newsgroup18828文本分类器、文本聚类器、关联分析频繁模式挖掘算法的Java实现工程下载及运行FAQ主要思路:利用google的Newsgroup18828文

2013-09-22 12:18:21 4740 1

原创 elasticsearch 查询内容精确匹配

在实际应用中,我们需要查询内容要完全匹配其内容。其实很简单。在查询内容前面加上双引号。例如String q="\""+"俄罗斯空军"+"\"";//q为要查询的数据QueryStringQueryBuilder queryBuilder = new QueryStringQueryBuilder(q); //analyzer

2013-08-18 08:41:04 5651

原创 elasticsearch 0.19.9升级到0.90.1实录

最近,我把公司的搜索集群升级了一下,elasticsearch 版本0.19.9升级到0.90.1版本。现在来说说步骤:1.确保索引服务器的索引数据添加到elasticsearch集群中(我们采用定时任务把索引数据添加到elasticsearch集群中)。2.停止索引服务器的运行。3.在浏览器中运行http://ipaddress:9200/_flush,这样确保索引数据能保存到硬盘中

2013-06-12 09:19:18 876

转载 elasticsearch获取java client实例

转载自:elasticsearch获取java client实例一般情况下,我们可以用如下方法获取一个java client。public Client getTransportClient(){ // 设置client.transport.sniff为true来使客户端去嗅探整个集群的状态,把集群中其它机器的ip地址加到客户端中, // 这

2013-05-22 17:28:40 3218 1

原创 IT技术精华网改版了

新的界面设计,新的风格。IT技术精华网 | 挖掘、分享、推荐IT技术精华内容。

2013-05-21 08:31:36 594

转载 Index.ANALYZED in lucene4 is deprecated

在lucene4中使用Index.ANALYZED提示 is deprecated (过期) ,在Lucene4中用FieldType来实现。在IndexableFieldType类中/** * True if this field's value should be analyzed by the * {@link Analyzer}. * * This has

2013-05-13 18:00:42 629

原创 我的新网站开张啦

我的新网站:IT技术精华网   欢迎光临!

2013-05-10 10:38:07 538

原创 Happy

今天,在CSDN开博客了! 

2008-03-05 15:18:00 568 1

在Windows上安装Hadoop教程

hadoop在windows下的安装步骤。学习hadoop最佳捷径。

2012-02-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除