- 博客(2)
- 资源 (3)
- 收藏
- 关注
翻译 社区划分算法
简介 使用许多互联网数据,我们都可以构建出这样的网络,其节点为某一种信息资源,如图片,视频,帖子,新闻等,连边为用户在资源之间的流动。对于这样的网络,使用社区划分算法可以揭示信息资源之间的相关性,这种相关性的发现利用了用户对信息资源的处理信息,因此比起单纯使用资源本身携带的信息来聚类(例如,使用新闻包含的关键词对新闻资源进行聚类),是一种更深刻的知识发现。网络社区划分的两种主要思路社区划分的算法比
2016-10-05 16:36:06 14879
原创 经典的分词方法实现(JAVA)
基于规则的自动分词算法原理(1) 事先人工建立好分词词典和分词规则库。 (2) 原理为基于字符串匹配进行分词,这样就要求有足够大的词表为依据。 (3) 通过一定的算法来实现,如正向最大匹配法、逆向最大匹配法、双向匹配法等。 (4) 忧缺点:当分词词典所收容的词较少时,显然覆盖度就有限,分词的正确率就低。正向最大匹配法算法描述设MaxLen表示最大词长,D为分词词典 (1) 从待切分语料中按正
2016-10-04 21:26:49 11282 2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人