- 博客(3)
- 资源 (7)
- 收藏
- 关注
转载 TF-IDF及其算法
TF-IDF及其算法概念 TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-ID
2014-12-24 22:30:50 420
转载 聚类算法k-means、k-modes和k-prototype介绍
聚类算法k-means、k-modes和k-prototype介绍之前分享了数学宅通过数据分析方法约会女神的故事,大家会不会觉得很酷呢!该宅所用的贝尔实验室k-modes算法看起来不明觉厉,那么我们今天就和大家讨论一下这个算法。同时,我们还会介绍另两个类似的算法,k-means和k-prototype。由于k-means更容易理解,所以我们从它开始。k-means聚类算法简单易行,时间复杂
2014-12-22 17:10:49 16833
转载 ID3 C4.5 C5.0
ID3算法是决策树的一个经典的构造算法,在一段时期内曾是同类研究工作的比较对象,但通过近些年国内外学者的研究,ID3算法也暴露出一些问题,具体如下: (1)信息增益的计算依赖于特征数目较多的特征,而属性取值最多的属性并不一定最优。 (2)ID3是非递增算法。 (3)ID3是单变量决策树(在分枝节点上只考虑单个属性),许多复杂概念的表达困难,属性相互关系强调
2014-12-22 00:59:43 2217
arcgis10下载、安装教程、许可文件
2015-11-28
毕业生信息管理系统
2010-10-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人