joey周琦

work for fun

机器学习算法之: 逻辑回归 logistic regression (LR)

by joey周琦 逻辑回归属于probabilistic discriminative model这一类的分类算法。probabilistic discriminative mode这类算法的思路如下: - 直接建模P(Ck|x)P(C_k|x) - 利用最大似然估计和训练数据,估计出模...

2015-08-29 23:43:33

阅读数:1183

评论数:0

机器学习算法之:分类算法概述

By joey周琦 常见的分类算法大致可以分为三类: 直接给一个discriminant function,直接确定输入feature x的属于哪一类。这类算法有SVM probabilistic discriminative model.该类方法直接给P(Ck | x)建模, Ck表示第k类。该...

2015-08-29 20:53:08

阅读数:445

评论数:0

统计学中常见的英文缩写

在看英文概率书籍时候遇见上述词汇,概念有所不清,下面我总结下 pmf:离散随机变量的概率密度函数,也有人翻译为概率质量函数。常见形式: Cpmf:就是离散随机变量的累积分布函数,不连续。 Pdf:连续随机变量的概率密度函数,常见形式如高斯概率密度函数。 Cdf:连续随机变量的累积分布函数(分布函数...

2015-08-29 17:15:41

阅读数:4061

评论数:0

经验分享:大学生研究生如何找到一份数据挖掘的工作

2015-08-25 09:19:10

阅读数:10126

评论数:0

如何利用python使用libsvm

一:libsvm包下载与使用:      LIBSVM是台湾大学林智仁(Lin Chih-Jen)副教授等开发设计的一个简单、易于使用和快速有效的SVM模式识别与回归的软件包,他不但提供了编译好的可在Windows系列系统的执行文件,还提供了源代码,方便改进.在作者主页http://www....

2015-08-25 09:19:05

阅读数:592

评论数:0

方差,样本方差,修正样本方差,均值,样本均值等概念

首先,明确一点,方差,均值,是对一个随机变量而言的。样本均值,样本方差是针对一个样本而言的。   举个例子,x是一个随机变量,,服从0均值,方差。根据x的分布,我们可以抽样的到N个样本。     针对于x这个随机变量: 均值是E(x)=0; 方差是D(x)=E(x^2)-E^2(x)...

2015-08-25 09:19:00

阅读数:2373

评论数:0

python numpy笔记:给matlab使用者

利用Numpy,python可以进行有效的科学计算。本文给过去常用matlab,现在正学习Numpy的人。 在进行矩阵运算等操作时,使用array还是matrix?? 简短的回答,更多的时候使用array.使用array的唯一缺点就是你必须使用’dot’函数来代替*来进行矩阵乘法。    ...

2015-08-25 09:18:58

阅读数:533

评论数:0

python 操作符笔记:

操作符 描述 x if y else z 三元描述(2.5新加)(类似于c中的 x?y:z ...

2015-08-25 09:18:55

阅读数:226

评论数:0

python调试 设置断点

1在所需要调试的地方加入如下代码:    import pdb    pdb.set_trace() 2调试代码常用命令:     实例请见参考文献: 1http://www.cnblogs.com/qi09/archive/2012/02/10/2344959.html 2h...

2015-08-25 09:18:53

阅读数:6658

评论数:1

数据关联分析 association analysis (Aprior算法,python代码)

1基本概念 购物篮事务(market basket transaction),如下表,表中每一行对应一个事务,包含唯一标识TID,和购买的商品集合。本文介绍一种成为关联分析(association analysis)的方法,这种方法,可以从下表可以提取出,{尿布}—>牛奶. 两个...

2015-08-25 09:18:50

阅读数:1766

评论数:0

python lambda 用法

可以视lambda为一个简易的函数,它不需要return,形式简单 #冒号左边是变量 #冒号右边是返回值 例: >>> def f (x): return x**2 ... >>> print f(8) 64 >>&...

2015-08-25 09:18:48

阅读数:288

评论数:0

简单的神经元算法实现(python)

参考python代码如下 #perceptron x=[[1 ,0, 0],[1,0,1],[1, 1, 0],[1, 1, 1],[0,0,1],[0,1,0],[0,1,1],[0,0,0]] y=[-1,1,1,1,-1,-1,1,-1]#真值 y_pre=[0,0,0,0,0,...

2015-08-25 09:18:46

阅读数:520

评论数:0

Permutation Test 置换检验(转)

Permutation Test 置换检验 显著性检验通常可以告诉我们一个观测值是否是有效的,例如检测两组样本均值差异的假设检验可以告诉我们这两组样本的均值是否相等(或者那个均值更大)。我们在实验中经常会因为各种问题(时间、经费、人力、物力)得到一些小样本结果,如果我们想知道这些小样本结果的总体...

2015-08-25 09:18:43

阅读数:10672

评论数:1

统计 p-value 含义

p-value是一种概率:在原假设为真的前提下,出现该样本或比该样本更极端的结果的概率之和。     例子: 我们假设 H0:出现正面的概率是1/2 扔硬币20次出现了14次正面.该样本的单边p-value计算如下:   考虑双边检验时候,p-value是单边的二倍...

2015-08-25 09:18:41

阅读数:3003

评论数:0

Fisher's exact test( 费希尔精确检验)

Fisher's exact test[1][2][3] is a statistical significance test used in the analysis ofcontingency tables. Although in practice it is employed when s...

2015-08-25 09:18:38

阅读数:5220

评论数:1

R语言中的箱图介绍 boxplot

画箱图的函数: boxplot()##help(boxplot)查询具体用法   图例的解释: 如下图,是两个简单的箱图。 中间的箱子的上下边,分别是第三,一个四分位数。 中间的黑线是第二四分位数(中位数)。 设r是变量的四分位距,箱图上方的小横线是小于或等于第三个四分...

2015-08-25 09:18:36

阅读数:14776

评论数:0

算法中的渐进符号 (符号总结说明)

在看有些算法书或资料的时候,经常看到时间复杂度,空间复杂度的符号描述。参考算法导论,在这里做个小总结,和大家分享。 1.记号:(渐进确界): : 表示={ f(n):存在常数c1,c2,,对所有的,有:}     2.O记号:(渐进上界) 记号渐进给出一个函数的上下界,当只有渐近上界...

2015-08-25 09:18:34

阅读数:3301

评论数:2

图模型的统计推断 inference in graphical models(马尔科夫链的推断)

有关因子图(factor graphs)以及其在sum product 算法,max-algorithm中的应用,将在一下篇博客中分享。 谢谢您的关注,欢迎提出意见问题。

2015-08-25 09:18:31

阅读数:483

评论数:0

概率图模型之有向图与无向图之间的关系 I map D map perfect map(完美图) 概念

我们已经讨论了有向图和无向图框架下的概率模型,那么我们有必要讨论一下它们二者的关系。

2015-08-25 09:18:29

阅读数:1050

评论数:0

马尔可夫随机场(Markov random fields) 概率无向图模型 马尔科夫网(Markov network)

上面两篇博客,解释了概率有向图(贝叶斯网),和用其解释条件独立。本篇将研究马尔可夫随机场(Markov random fields),也叫无向图模型,或称为马尔科夫网(Markov network)         下面附上,上述实验的matlab代码。没有插入matlab选项,大家...

2015-08-25 09:18:26

阅读数:2071

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭