聚类相关
文章平均质量分 83
蓁蓁尔
A goal is a dream with a deadline.
展开
-
文本聚类算法简要介绍
1. 传统的文本聚类算法 传统的文本聚类算法分为以下几种 1.1 分割方法(partitioning methods) 1.1.1 K-MEANS算法: 工作原理: 首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类转载 2015-12-03 09:28:37 · 1189 阅读 · 0 评论 -
聚类相关词汇扫盲
1.停止词,是由英文单词:stopword翻译过来的,原来在英语里面会遇到很多a,the,or等使用频率很多的字或词,常为冠词、 介词、 副词或 连词等。如果 搜索引擎要将这些词都索引的话,那么几乎每个网站都会被索引,也就是说工作量巨大。可以毫不夸张的说句,只要是个英文网站都会用到a或者是the。那么这些英文的词跟我们中文有什么关系呢? 在中文网站里面其实也存在大量的stopword,我们称它转载 2015-12-14 15:30:43 · 748 阅读 · 0 评论 -
准确率-召回率,击中率-虚警率,PR曲线和mAP,ROC曲线和AUC
转自:http://blog.csdn.net/wangzhiqing3/article/details/9058523 在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近根据网友的博客做了一个汇总。准确率、召回率、F1 信息检索、分类、识别、翻译等领域两个最基本指标是召回率(Recall Rate)和准确率(Precision Rate),召回率也叫转载 2016-10-25 15:11:31 · 4843 阅读 · 0 评论 -
深度学习+推荐--近期论文总结
一。推荐任务分三类: 评分预测类任务(近几年热度:2), 排序预测类任务(top N 推荐,近几年热度:3) 分类任务(热度:1)。 推荐系统算法方面分三类: 协同过滤(CF), 基于内容的推荐(CB) 混合推荐。 二。目前的推荐算法中用到的8类深度学习模型: MLP(理论上可以拟合各种函数,可以非常容易的model用户和项目间的非线性关系), AE及其变体(非监督,超强的特征学习能力),原创 2017-08-01 21:22:14 · 2779 阅读 · 0 评论