ml
文章平均质量分 78
沧笙踏歌lzm
nlp、ml狂热分子
展开
-
Python 实现pagerank
pagerank的源代码如下:#coding=utf-8S=[[0.25,0,0,0],[0.25,0,0,1],[0.25,0.5,0,0],[0.25,0.5,1,0]] #转移矩阵M=[0.25,0.25,0.25,0.25] #初始矩阵alpha=0.85 # 阻尼系数def vmat(mat, vector): if len(ma原创 2015-12-09 00:31:16 · 1311 阅读 · 0 评论 -
python实现密度聚类
1.密度聚类的简单介绍:常见的密度聚类包括DBSCAN聚类和密度最大值聚类等。本文主要讲的是DBSCAN聚类。DBSCAN聚类是一个比较有代表性的基于密度的聚类算法,与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在有“噪声”的数据中发现任意形状的聚类,而不局限于凸多边形的聚类,凹多边形同样可以聚类。2.DBSCAN密度聚类的一些基原创 2015-12-02 00:12:22 · 7069 阅读 · 1 评论 -
python实现层次聚类
1.层次聚类的简单介绍层次聚类方法对给定的数据集进行层次的分解,直到某种条件满足或者达到最大迭代次数。具体又可分为:凝聚的层次聚类(AGNES算法):一种自底向上的策略,首先将每个对象作为一个簇,然后合并这些原子簇为越来越大的簇(一般是计算所有簇的中心之间的距离,选取距离最小的两个簇合并),直到某个终结条件被满足或者达到最大迭代次数。分裂的层次聚类(DIANA算法):采用自顶向下的原创 2015-12-01 23:55:46 · 12339 阅读 · 0 评论 -
GBDT(MART) 迭代决策树入门教程 | 简介
转载自http://blog.csdn.net/w28971023/article/details/8240756: GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案转载 2015-11-24 22:25:13 · 310 阅读 · 0 评论 -
关于LSA(Latent Semantic Analysis)主题模型的个人理解
LSA把高维向量空间模型表示中的文档映射到低维潜在语义空间中,在潜在语义空间计算相似性,这个映射通过对词项-文档矩阵SVD分解来实现。原创 2015-07-01 11:43:08 · 9348 阅读 · 1 评论 -
windows7 64bite环境安装theano
其实Windows7安装theano非常简单,具体步骤如下:1.安装anaconda 下载地址:http://www.continuum.io/downloads按照默认设置安装即可。2. 安装Theano在安装的Anaconda2目录下打开命令窗口,pip install theano安装完之后可能会有警告:原创 2016-08-13 12:52:55 · 367 阅读 · 0 评论