机器学习
文章平均质量分 78
Waleking
这个作者很懒,什么都没留下…
展开
-
建议的程序员学习LDA算法的步骤
原文地址:http://tech.it168.com/a2011/0801/1225/000001225832.shtml这一阵为了工作上的关系,花了点时间学习了一下LDA算法,说实话,对于我这个学CS而非学数学的人来说,除了集体智慧编程这本书之外基本没怎么看过机器学习的人来说,一开始还真是摸不太到门道,前前后后快要四个月了,算是基本了解了这个算法的实现,记录一下,也供后来人快速入门做个参转载 2012-02-18 20:50:38 · 2042 阅读 · 0 评论 -
scipy.sparse求稀疏矩阵前k个特征值
背景:要在python中处理7000*7000的稀疏矩阵,计算前k小的特征值和相应的特征向量。不想在matlab中做这件事了,所有的数据预处理和展现工作都想在python中完成。然而一般的linalg提供的eig开销太大,要计算所有的特征值和特征向量,这个开销要达到 O(N^3),对于谱聚类来说,这个开销是不能忍受的。所以要借助稀疏矩阵计算的工具包。探索过程:使用scipy.spa原创 2012-05-30 13:03:52 · 14438 阅读 · 6 评论 -
完整的最简单的谱聚类python代码
针对karate_club数据集,做了谱聚类。由于是2-way clustering,比较简单,得到了图的新的表示空间之后,没有做k-means,仅仅针对正规化后的拉普拉斯矩阵的第二特征值做了符号判断,这和Spectral Clustering Tutorial 一文中的描述一致。引用了numpy scipy matplotlib networkx包#coding=utf-8#MSC原创 2012-05-20 01:07:11 · 16231 阅读 · 6 评论 -
机器学习各类工具weka、scikit-learn等各项指标的对比
以下表格摘自:http://www.shogun-toolbox.org/另推荐机器学习软件汇总网站 http://mloss.org/software/featureshogunwekakernlabdlibniemeorangejava-mlpyMLmlpypybraintorch3scikit-learn翻译 2012-05-20 02:29:10 · 19566 阅读 · 4 评论 -
线性回归问题解的唯一性
线性回归问题在Andrew Ng的视频教学《机器学习》的第二章中有提到,可以用梯度下降的方法来解决其中的参数估计问题。Ng指出梯度下降法在线性回归问题中必然全局收敛,因为这个问题只有一个极值点。这也就意味着线性回归问题的解是唯一的。我们现在要证明这个解的唯一性。在证明唯一性之前,先求解线性回归问题。定义1:观察数据X。样本数据由一个m×(n+1)的矩阵X表达,其中m是样本数,n是样原创 2012-08-03 16:57:53 · 8515 阅读 · 0 评论 -
python中做层次聚类,使用scipy.cluster.hierarchy.fclusterdata方法
python机器学习包里面的cluster提供了很多聚类算法,其中ward_tree实现了凝聚层次聚类算法。但是没有看明白ward_tree的返回值代表了什么含义,遂决定寻找别的实现方式。经过查找,发现scipy.cluster.hierarchy.fclusterdata能够实现层次聚类。有关这个方法的介绍在:http://docs.scipy.org/doc/scipy/referen原创 2012-07-31 17:39:05 · 30016 阅读 · 0 评论