![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
搜索、文本分类、聚类相关
forandever
做点什么
展开
-
Lucene搜索时,索引如何reopen
<br />Lucene搜索时,索引如何reopen<br />@2010-8-30 for&ever<br /> <br />IndexReader是一个线程安全的对象,跟索引目录是一一对应,实例化IndexReader很耗资源,通常搜索时同一个索引目录只需要实例化一个IndexReader即可。<br />当索引数据比较大的时候,一般把索引数据按照某种规则散列在多个文件目录(如:indexdir0,indexdir01,indexdir02)。 <br />当索引目录有增量更新时,可以使用lucene的原创 2010-08-30 11:05:00 · 3264 阅读 · 0 评论 -
libsvm中svm-scale的使用时的一个小问题
<br />使用libsvm中svm-scale的时候,遇到如下的小问题:<br /> <br />原始数据文件test的内容:<br />1 1:-1 2:-1 3:-1 4:1 5:-1 6:1 7:-1 8:1 9:-1 <br />2 1:1 2:1 3:-1 4:1 5:-1 6:-1 7:1 8:1 9:-1 <br />3 1:1 2:1 3:1 4:-1 5:1 6:-1 7:-1 8:-1 9:1 <br /><br />执行 svm-scale.exe test > test.sca原创 2010-12-01 13:47:00 · 4326 阅读 · 0 评论 -
K-MEANS算法
<br />K-MEANS算法:<br />输入:聚类个数k,以及包含 n个数据对象的数据库。<br />输出:满足方差最小标准的k个聚类。<br />处理流程: <br />(1) 从 n个数据对象任意选择 k 个对象作为初始聚类中心;<br />(2) 循环(3)到(4)直到每个聚类不再发生变化为止<br />(3) 根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;<br />(4) 重新计算每个(有变化)聚类的均值(中心原创 2010-11-08 14:48:00 · 1055 阅读 · 0 评论 -
在mac OSX上安装OpenCV + Java环境
之前一篇文章是通过brew的方式安装o'p原创 2014-05-26 17:45:27 · 6378 阅读 · 3 评论