- 博客(0)
- 资源 (3)
- 收藏
- 关注
k-means算法详解
在网上看到了很关于10大算法的一些博客讲解,大多都支离破碎讲解的部分,而且不同的博客讲解的方式很多不同,我希望能重新整理这些基础算法,尽量更全面和深入一些,分享出来,共大家参考。
k-means 【3】算法,也被称为k-平均或k-均值,是一种得到最广泛使用的聚类算法。它是一种得到最广泛使用的基于划分的聚类算法,把n个对象分为k个簇,以使簇内具有较高的相似度。相似度的计算根据一个簇中对象的平均值来进行。算法的主要思想是通过迭代过程把数据集划分为不同的类别,使得评价聚类性能的准则函数达到最优,从而使生成的每个聚类内紧凑,类间独立。它与处理混合正态分布 【1】的最大期望算法 【2】很相似,因为他们都试图找到数据中自然聚类的中心。
2015-01-02
word2vec理论推导
之前在网上看过很多关于word2vec 的学习笔记,但都是拿拿其中一小部分进行阐述,基本没有比较全面和深入的讲解。由于word2vec涉及的基础知识比较多,对于word2vec如果要全面,可能要从基础线性回归 [10]、最小二乘法 [11]、sigmoid函数 [9][12]、Huffman树 [13]、softmax回归 [9][14]、词向量 [15]、似然估计 [17]等等。如需要了解基础知识,请先看相关参数文献;如需较全面的预热,请参考网易发一篇文章 [18](相信对word2vec有兴趣的同学都看过)。
本文适合在对word2vec算法有一定基础上,但想进一步了解word2vec的实现细节的同学。如遇到问题,最好参照着google源码实现进行理解(文章最后有源码参考)。
2015-01-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人