自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(174)
  • 资源 (3)
  • 收藏
  • 关注

转载 再谈协方差矩阵之主成分分析

自从上次谈了协方差矩阵之后,感觉写这种科普性文章还不错,那我就再谈一把协方差矩阵吧。上次那篇文章在理论层次介绍了下协方差矩阵,没准很多人觉得这东西用处不大,其实协方差矩阵在好多学科里都有很重要的作用,比如多维的正态分布,再比如今天我们今天的主角——主成分分析(Principal Component Analysis,简称PCA)。结合PCA相信能对协方差矩阵有个更深入的认识~PCA的缘

2015-05-18 08:45:47 659

转载 IntelliJ IDEA 14 注册码

IntelliJ IDEA 14 下载地址:IntelliJ IDEA 14 下载 分享几个license:(1)key:IDEAvalue:61156-YRN2M-5MNCN-NZ8D2-7B4EW-U12L4 (2)key:huangweivalue:97493-G3A41-0SO24-W57LI-Y2UGI-JGTU2

2015-05-18 08:32:37 472

原创 Unknown mysql sever host 'localhost'错误

1、解决方法:重启mysql2、具体操作:1)、点击“开始”->“运行”(快捷键Win+R) 2)、启动:输入 net stop mysql 3)、停止:输入 net start mysql

2015-05-07 19:42:13 1986

转载 国内国外最好的java开发论坛及站点

国内: www.chinajavaworld.com -论坛人很多,高手也多,不过好像都在潜水     www.cn-java.com -也很不错,文章很好,但是就是商业性浓了点。     www.chinaitlab.com- 非常有系统性,而且推出的java远程教育是中国最全面的scjp远程教育。 www.huihoo.com -灰狐动力,有个jfox,而且很多关于企业级应用的

2015-05-07 10:50:52 794

原创 如何理解Beta分布和Dirichlet分布?

背景在Machine Learning中,有一个很常见的概率分布叫做Beta Distribution:同时,你可能也见过Dirichelet Distribution:那么Beta Distribution和Dirichlet Distribution的意义何在呢?解释1. 如果给你一个硬币,投这个硬币有\theta的概率抛出Hea

2015-05-04 10:01:43 1328

原创 数据的平稳性

一、数据平稳性李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归(spurious regression)。他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。

2015-05-02 15:48:17 23075

原创 Python读写csv文件

1. 写入并生成csv文件代码:csvfile=file('E:\temp.csv','wb')writer=csv.writer(csvfile)writer.writerow(['姓名','年龄','电话'])data=[ ('小','25','1234567'),('大','23','789')]writer.writerows(data)csvfile

2015-04-24 20:24:10 555

转载 Kmeans、Kmeans++和KNN算法比较

K-Means介绍       K-means算法是聚类分析中使用最广泛的算法之一。它把n个对象根据他们的属性分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。其聚类过程可以用下图表示:        如图所示,数据样本用圆点表示,每个簇的中心点用叉叉表示。(a)刚开始时是原始数据,杂乱无章,没有label,看起来都一样

2015-04-21 16:39:09 427

原创 简单的文本相似性测量(Python实现)

一、数据集与测试集数据集:测试集:imaging databases二、Python代码# -*- coding: utf-8 -*-"""Created on Mon Apr 13 09:49:25 2015@author: Administrator"""import numpyimport sysimport scipy as sp impo

2015-04-19 23:07:12 879

转载 Git教程:多人协作

当你从远程仓库克隆时,实际上Git自动把本地的master分支和远程的master分支对应起来了,并且,远程仓库的默认名称是origin。要查看远程库的信息,用git remote:$ git remoteorigin或者,用git remote -v显示更详细的信息:$ git remote -vorigin [email protected]:michaelliao/

2015-04-19 15:06:48 333

转载 Git教程:使用GitHub

我们一直用GitHub作为免费的远程仓库,如果是个人的开源项目,放到GitHub上是完全没有问题的。其实GitHub还是一个开源协作社区,通过GitHub,既可以让别人参与你的开源项目,也可以参与别人的开源项目。在GitHub出现以前,开源项目开源容易,但让广大人民群众参与进来比较困难,因为要参与,就要提交代码,而给每个想提交代码的群众都开一个账号那是不现实的,因此,群众也仅限于报个bug

2015-04-19 15:06:15 382

转载 Git教程:Bug分支

软件开发中,bug就像家常便饭一样。有了bug就需要修复,在Git中,由于分支是如此的强大,所以,每个bug都可以通过一个新的临时分支来修复,修复后,合并分支,然后将临时分支删除。当你接到一个修复一个代号101的bug的任务时,很自然地,你想创建一个分支issue-101来修复它,但是,等等,当前正在dev上进行的工作还没有提交:$ git status# On branch dev

2015-04-19 15:05:19 273

转载 Git教程:Feature分支

软件开发中,总有无穷无尽的新的功能要不断添加进来。添加一个新功能时,你肯定不希望因为一些实验性质的代码,把主分支搞乱了,所以,每添加一个新功能,最好新建一个feature分支,在上面开发,完成后,合并,最后,删除该feature分支。现在,你终于接到了一个新任务:开发代号为Vulcan的新功能,该功能计划用于下一代星际飞船。于是准备开发:$ git checkout -

2015-04-19 15:04:44 495

转载 Git教程:分支管理策略

通常,合并分支时,如果可能,Git会用Fast forward模式,但这种模式下,删除分支后,会丢掉分支信息。如果要强制禁用Fast forward模式,Git就会在merge时生成一个新的commit,这样,从分支历史上就可以看出分支信息。下面我们实战一下--no-ff方式的git merge:首先,仍然创建并切换dev分支:$ git checkout -b d

2015-04-19 15:03:02 375

转载 Git教程:解决冲突

人生不如意之事十之八九,合并分支往往也不是一帆风顺的。准备新的feature1分支,继续我们的新分支开发:$ git checkout -b feature1Switched to a new branch 'feature1'修改readme.txt最后一行,改为:Creating a new branch is quick AND simple.在feat

2015-04-19 15:02:14 424

转载 Git教程:创建与合并分支

在版本回退里,你已经知道,每次提交,Git都把它们串成一条时间线,这条时间线就是一个分支。截止到目前,只有一条时间线,在Git里,这个分支叫主分支,即master分支。HEAD严格来说不是指向提交,而是指向master,master才是指向提交的,所以,HEAD指向的就是当前分支。一开始的时候,master分支是一条线,Git用master指向最新的提交,再用HEAD指向master,就能

2015-04-19 15:01:30 399

转载 Git教程:从远程库克隆

上次我们讲了先有本地库,后有远程库的时候,如何关联远程库。现在,假设我们从零开发,那么最好的方式是先创建远程库,然后,从远程库克隆。首先,登陆GitHub,创建一个新的仓库,名字叫gitskills:我们勾选Initialize this repository with a README,这样GitHub会自动为我们创建一个README.md文件。创建完毕后,可以看到READM

2015-04-19 15:01:21 418

转载 Git教程:分支管理

分支就是科幻电影里面的平行宇宙,当你正在电脑前努力学习Git的时候,另一个你正在另一个平行宇宙里努力学习SVN。如果两个平行宇宙互不干扰,那对现在的你也没啥影响。不过,在某个时间点,两个平行宇宙合并了,结果,你既学会了Git又学会了SVN!分支在实际中有什么用呢?假设你准备开发一个新功能,但是需要两周才能完成,第一周你写了50%的代码,如果立刻提交,由于代码还没写完,不完整

2015-04-19 15:00:50 311

转载 Git教程:添加远程库

现在的情景是,你已经在本地创建了一个Git仓库后,又想在GitHub创建一个Git仓库,并且让这两个仓库进行远程同步,这样,GitHub上的仓库既可以作为备份,又可以让其他人通过该仓库来协作,真是一举多得。首先,登陆GitHub,然后,在右上角找到“Create a new repo”按钮,创建一个新的仓库:在Repository name填入learngit,其他保持默认

2015-04-19 14:59:00 407

转载 Git教程:远程仓库

到目前为止,我们已经掌握了如何在Git仓库里对一个文件进行时光穿梭,你再也不用担心文件备份或者丢失的问题了。可是有用过集中式版本控制系统SVN的童鞋会站出来说,这些功能在SVN里早就有了,没看出Git有什么特别的地方。没错,如果只是在一个仓库里管理文件历史,Git和SVN真没啥区别。为了保证你现在所学的Git物超所值,将来绝对不会后悔,同时为了打击已经不幸学了SVN的童鞋,本章开始

2015-04-19 14:58:18 358

转载 Git教程:撤销修改

自然,你是不会犯错的。不过现在是凌晨两点,你正在赶一份工作报告,你在readme.txt中添加了一行:$ cat readme.txtGit is a distributed version control system.Git is free software distributed under the GPL.Git has a mutable index called stage.

2015-04-19 14:57:24 386

转载 Git教程:删除文件

在Git中,删除也是一个修改操作,我们实战一下,先添加一个新文件test.txt到Git并且提交:$ git add test.txt$ git commit -m "add test.txt"[master 94cdc44] add test.txt 1 file changed, 1 insertion(+) create mode 100644 test.txt一般情况

2015-04-19 14:57:16 478

转载 Git教程:管理修改

现在,假定你已经完全掌握了暂存区的概念。下面,我们要讨论的就是,为什么Git比其他版本控制系统设计得优秀,因为Git跟踪并管理的是修改,而非文件。你会问,什么是修改?比如你新增了一行,这就是一个修改,删除了一行,也是一个修改,更改了某些字符,也是一个修改,删了一些又加了一些,也是一个修改,甚至创建一个新文件,也算一个修改。为什么说Git管理的是修改,而不是文件呢?我们还是做实验。第

2015-04-19 14:56:27 320

转载 Git教程:工作区和暂存区

Git和其他版本控制系统如SVN的一个不同之处就是有暂存区的概念。先来看名词解释。工作区(Working Directory):就是你在电脑里能看到的目录,比如我的learngit文件夹就是一个工作区:版本库(Repository):工作区有一个隐藏目录.git,这个不算工作区,而是Git的版本库。Git的版本库里存了很多东西,其中最重要的就是称为stage

2015-04-19 14:54:19 395

转载 Git教程:时光机穿梭

我们已经成功地添加并提交了一个readme.txt文件,现在,是时候继续工作了,于是,我们继续修改readme.txt文件,改成如下内容:Git is a distributed version control system.Git is free software.现在,运行git status命令看看结果:$ git status# On branch master#

2015-04-19 14:53:57 377

转载 Git教程:版本回退

现在,你已经学会了修改文件,然后把修改提交到Git版本库,现在,再练习一次,修改readme.txt文件如下:Git is a distributed version control system.Git is free software distributed under the GPL.然后尝试提交:$ git add readme.txt$ git commit -m

2015-04-19 14:53:18 507

转载 Git教程:创建版本库

什么是版本库呢?版本库又名仓库,英文名repository,你可以简单理解成一个目录,这个目录里面的所有文件都可以被Git管理起来,每个文件的修改、删除,Git都能跟踪,以便任何时刻都可以追踪历史,或者在将来某个时刻可以“还原”。所以,创建一个版本库非常简单,首先,选择一个合适的地方,创建一个空目录:$ mkdir learngit$ cd learngit$ pwd/Users

2015-04-19 14:52:01 326

转载 Git教程:安装Git

最早Git是在Linux上开发的,很长一段时间内,Git也只能在Linux和Unix系统上跑。不过,慢慢地有人把它移植到了Windows上。现在,Git可以在Linux、Unix、Mac和Windows这几大平台上正常运行了。要使用Git,第一步当然是安装Git了。根据你当前使用的平台来阅读下面的文字:在Linux上安装Git首先,你可以试着输入git,看看系统有没有安装G

2015-04-19 14:51:16 377

转载 Git教程:Git的诞生

很多人都知道,Linus在1991年创建了开源的Linux,从此,Linux系统不断发展,已经成为最大的服务器系统软件了。Linus虽然创建了Linux,但Linux的壮大是靠全世界热心的志愿者参与的,这么多人在世界各地为Linux编写代码,那Linux的代码是如何管理的呢?事实是,在2002年以前,世界各地的志愿者把源代码文件通过diff的方式发给Linus,然后由Linus本人

2015-04-19 14:46:59 276

转载 文本语言模型的参数估计-最大似然估计、MAP及贝叶斯估计

以PLSA和LDA为代表的文本语言模型是当今统计自然语言处理研究的热点问题。这类语言模型一般都是对文本的生成过程提出自己的概率图模型,然后利用观察到的语料数据对模型参数做估计。有了语言模型和相应的模型参数,我们可以有很多重要的应用,比如文本特征降维、文本主题分析等等。本文主要介绍文本分析的三类参数估计方法-最大似然估计MLE、最大后验概率估计MAP及贝叶斯估计。1、最大似然估计

2015-04-17 19:52:36 501

转载 Conjugate prior-共轭先验的解释

一 问题来源:看PRML第二章时遇到的。二 问题描述:PRML第68页说:“We shall see that an import role is played by conjugate priors, that lead to posterior distributions having the same functional form as the prior , and

2015-04-17 17:24:18 782

原创 多项分布

1、背景多项式分布(Multinomial Distribution)是二项式分布的推广。二项分布的典型例子是扔硬币,硬币正面朝上概率为p, 重复扔n次硬币,k次为正面的概率即为一个二项分布概率。(严格定义见伯努利实验定义)。把二项分布公式推广至多种状态,就得到了多项分布。2、多项分布某随机实验如果有k个可能结局A1、A2、…、Ak,分别将他们的出现次数记为随机变量

2015-04-17 13:47:08 4210

转载 机器学习中的常用分布

基本概念:1. 样本空间:实验所有可能的输出的集合。2. 随机变量:随机变量是一个映射(或函数),将映射到实数集。可以分为离散型随机变量和连续型随机变量。3. pmf和pdf:pmf(probability mass function)为离散型随机变量的概率分布,定义为,有是也写成f(x);对于连续型随机变量,则p称为pdf(probability density fu

2015-04-17 11:02:48 1507

原创 朴素贝叶斯方法

前言         朴素贝叶斯(NaïveBayes)法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先是基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。朴素贝叶斯方法实现简单,学习与预测的效率都很高,是一种常用的方法。1.1朴素贝叶斯的学习与分类1.1.1基本方法

2015-04-17 10:42:57 2800

原创 二项分布(Python)

1、背景 在概率论和统计学中,二项分布是n个独立的[是/非]试验中成功的次数的离散概率分布,其中每次试验的成功概率为p。举两个例子就很容易理解二项分布的含义了:抛一次硬币出现正面的概率是0.5(p),抛10(n)次硬币,出现k次正面的概率。掷一次骰子出现六点的概率是1/6,投掷6次骰子出现k次六点的概率。在上面的两个例子中,每次抛硬币或者掷骰子都和上次的

2015-04-16 22:53:42 8058

转载 线性代数导论33——第三阶段总结

本文是Gilbert Strang的线性代数导论课程笔记。课程地址:http://v.163.com/special/opencourse/daishu.html  第三十三课时:第三阶段总结复习本讲梳理知识要点:1)特征值与特征向量Ax=λx;2)微分方程;3)对称矩阵A=AT的特征值是实数,总存在足够的特征向量特征值使它可以对角化:A=QΛQT;4)正定矩阵是特征值均为正的对称矩阵

2015-04-16 20:17:38 898

转载 线性代数导论35——线性代数全总结

本文是Gilbert Strang的线性代数导论课程笔记。课程地址:http://v.163.com/special/opencourse/daishu.html  第三十五课时:线性代数全总结本节是Gilbert Strang主讲的线性代数导论最后一讲,我想我会想念这位伟大的教授的!任何科学都离不开数学,对计算机科学尤其如此,数据挖掘,机器学习都要以线性代数为

2015-04-16 20:17:31 499

转载 线性代数导论34——左右逆和伪逆

本文是Gilbert Strang的线性代数导论课程笔记。课程地址:http://v.163.com/special/opencourse/daishu.html  第三十四课时:左右逆和伪逆本讲的主题是左右逆,伪逆,当然也包括以前的内容,四个基本子空间。Am×n,m行n列1)矩阵可逆:即两边逆,AA-1 = I = A-1A ,

2015-04-16 20:16:40 983

转载 线性代数导论30——奇异值分解

本文是Gilbert Strang的线性代数导论课程笔记。课程地址:http://v.163.com/special/opencourse/daishu.html  第三十课时:奇异值分解本讲讲奇异值分解SVD=Singular Value Decomposition,这是矩阵最终和最好的分解。任意矩阵A=UΣVT,分解的因子是正交矩阵,对角矩阵,正交矩阵。正定

2015-04-16 20:15:46 787

转载 线性代数导论32——基变换和图像压缩

本文是Gilbert Strang的线性代数导论课程笔记。课程地址:http://v.163.com/special/opencourse/daishu.html  第三十二课时:基变换和图像压缩本讲关于基变换,从一组基变换到另外一组基,这在应用中比较常见,还会讲有关应用信号压缩,图像压缩。主题仍是线性变换与矩阵关联。图像压缩——傅里叶变换压缩包括无损压

2015-04-16 20:15:22 1652 1

python3.4matplotlib

matplotlib 是python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地进行制图。而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中。它的文档相当完备,并且 Gallery页面 中有上百幅缩略图,打开之后都有源程序。

2015-04-12

Python 2.7.9操作手册

Python 2.7.9操作手册{Python(英语发音:/ˈpaɪθən/), 是一种面向对象、解释型计算机程序设计语言,由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年,Python 源代码同样遵循 GPL(GNU General Public License)协议[1] 。Python语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C/C++重写,而后封装为Python可以调用的扩展类库。需要注意的是在您使用扩展类库时可能需要考虑平台问题,某些可能不提供跨平台的实现}

2015-04-09

Python 2.7.9 Documentation

python 2.7.9的用户手册。These archives contain all the content in the documentation.

2014-12-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除