自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 资源 (5)
  • 收藏
  • 关注

转载 聚类相关词汇扫盲

1.停止词,是由英文单词:stopword翻译过来的,原来在英语里面会遇到很多a,the,or等使用频率很多的字或词,常为冠词、 介词、 副词或 连词等。如果 搜索引擎要将这些词都索引的话,那么几乎每个网站都会被索引,也就是说工作量巨大。可以毫不夸张的说句,只要是个英文网站都会用到a或者是the。那么这些英文的词跟我们中文有什么关系呢? 在中文网站里面其实也存在大量的stopword,我们称它

2015-12-14 15:30:43 741

转载 文本聚类算法简要介绍

1. 传统的文本聚类算法  传统的文本聚类算法分为以下几种1.1 分割方法(partitioning methods)1.1.1 K-MEANS算法:工作原理:首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类

2015-12-03 09:28:37 1068

hetesim简单实现

简单的矩阵实现。具体的可以根据论文的后半部分矩阵实现和这个小例子的程序更改。

2018-04-16

用数据可视化直观理解数据--iris数据集为例

用数据可视化直观理解数据--iris数据集为例,python实现,seaborn pandas matplotlib

2017-04-07

PathSim代码实现

异构信息网络中基于元路径APVPA的相似度PathSim实现,基于Path2.7

2016-03-29

java2 应用编程150例 【源码全】

《java2 应用编程150例 》书中所有源码

2014-11-12

JAVA实验程序及答案

java实验程序及代码 面向对象程序设计实验及代码。

2014-03-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除