enjoyhot的专栏

All things come to those who wait

【machine learning】朴素贝叶斯分类方法

本文主要讲述利用朴素贝叶斯进行分类的问题。朴素贝叶斯是贝叶斯决策理论的一部分,所以讲述朴素负叶斯之前有必要快速了解一下贝叶斯决策理论。

2015-05-19 15:31:15

阅读数 1566

评论数 0

PageRank模型中的参数与其敏感性分析

PageRank模型中的参数与其敏感性分析

2015-05-11 15:10:39

阅读数 2187

评论数 0

EM算法嗅探

在统计计算中,最大期望(EM)算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量(Latent Variable)。最大期望经常用在机器学习和计算机视觉的数据聚类(Data Clustering)领域。

2015-05-10 15:57:15

阅读数 1370

评论数 0

【machine learning】GMM算法(Python版)

事实上,GMM 和 k-means 很像,不过 GMM 是学习出一些概率密度函数来(所以 GMM 除了用在 clustering 上之外,还经常被用于 density estimation ),简单地说,k-means 的结果是每个数据点被 assign 到其中某一个 cluster 了,而 GM...

2015-05-08 17:34:36

阅读数 14866

评论数 12

【machine learning】KMeans算法(Python版)

一、概述刚开始想要学习LDA主题模型的建模方法,学习的过程中发现应用到了EM算法,所以还是打算由浅及深地进行,发现EM算法虽然简单只有E步和M步的不断迭代,但其应用却很广泛,比较有名的有GMM算法和本博文要将的KMeans算法。作为数据挖掘十大经典算法之一,EM算法定义为:在统计中被用于寻找,依赖...

2015-05-08 13:18:01

阅读数 1858

评论数 1

通过欢迎度对网页排名

Jon Kleinberg致力于HITS的万维网搜索引擎项目,两名博士生正在从事一项名为PageRank的类似项目,分别是Sergey Brin和Larry Page。这两个模型之间的联系令人吃惊。然而,Jon并未试图将HITS发展成为一家公司,不过后来企业家们却试着去做了。

2015-05-03 15:18:56

阅读数 1414

评论数 0

php、python、ruby——web脚本语言的比较

在过去几年里,在web应用程序编程中,脚本语言变得越来越受欢迎。本论文试图在如今三种最受欢迎的语言:PHP、Python和Ruby中找到其中的差异、优点、缺点。很明显,他们有他们自己的观点和支持,所以要陈述客观事实并满足一种科学的方法是一项困难的任务。这三种语言将在web应用程序环境进行有关历史、...

2015-04-21 13:52:12

阅读数 4092

评论数 0

网络搜索引擎简介

网络搜索引擎简介一、传统信息检索回顾传统信息检索文档集的搜索有三种基本的计算机辅助技术:布尔模型、向量空间模型和概率模型。这些模型发展与20世纪60年代,直到2000年6月,便存在3500种不同的搜索引擎技术,并且大多数搜索引擎仍然依赖于以上三种基本模型的一种或数种。下图摘自《搜索引擎-原理技术与...

2015-04-21 13:34:17

阅读数 1065

评论数 0

网页排名PR值及其他——搜索引擎排序的科学(启)

在开始写搜索引擎PR值系列前,说明一下: 该系列来自《网页排名PR值及其他——搜索引擎排序的科学》,作者Amy N.Langville和Carl D.Meyer,看了1/3,,内容由浅及深,感觉不错,适合即将涉及搜索领域的同学。 之后将会分几篇博客进行简单扼要介绍。 初学者一枚,欢迎讨论。 CSD...

2015-04-21 12:01:43

阅读数 884

评论数 0

CSDN博客迁移

一、综述 最开始的博客用的是oschina, 自我感觉小清新,支持比较多风格的编辑器,容易编辑程度比csdn的要好。后来因为csdn人气的关系,又转到csdn,不过csdn编辑确实比较虐心,再后来就在服务器上搭一个WordPress的博客,不过用起来不是很爽。几个月前支持Markdown编辑,这...

2015-03-29 15:19:20

阅读数 729

评论数 0

HPC集群平台搭建概念

HPC高性能计算集群的搭建相关概念

2015-03-24 15:09:20

阅读数 6080

评论数 0

HPC性能测试

说到高性能计算,一般都是利用搭建集群配合加速卡做并行计算实现。但用相同的硬件实现更快的方法,那就是做测试了。比较有名的就是Linpack测试了。本文将谈到HPCC测试和NAMD测试。

2015-03-24 14:43:10

阅读数 3801

评论数 0

学习感悟

想想,记记。

2015-03-19 13:42:57

阅读数 613

评论数 0

【machine learning】KNN算法

kNN算法的指导思想是“近朱者赤,近墨者黑”,由你的邻居来推断出你的类别。

2015-02-25 16:04:01

阅读数 1270

评论数 0

django分页技术Paginator(进阶篇)

django分页技术Paginator(进阶篇)

2015-01-23 19:01:43

阅读数 1934

评论数 0

网络爬虫框架scrapy介绍及应用——抓取新浪新闻的标题内容评论

网络爬虫框架scrapy介绍及应用——抓取新浪新闻的标题内容评论

2015-01-21 15:12:37

阅读数 9041

评论数 7

【machine learning】regularization

机器学习范式,正则化

2015-01-21 14:57:31

阅读数 1074

评论数 0

【machine learning】linear regression

机器学习,线性回归

2015-01-18 19:43:56

阅读数 649

评论数 0

machine learning概述

machine learning概述

2015-01-18 16:19:33

阅读数 985

评论数 0

python进行文档抽取与解析的简单实现

python进行文档抽取与解析的简单实现

2015-01-18 13:36:38

阅读数 2490

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭