- 博客(683)
- 资源 (104)
- 收藏
- 关注
原创 使用github搭建网站
http://blog.csdn.net/pipisorry/article/details/51707366使用github建站github设计了Pages功能,允许用户自定义项目首页,用来替代默认的源码列表。所以,github Pages可以被认为是用户编写的、托管在github上的静态网页。github提供模板,允许站内生成网页,但也允许用户自己编写网页,然后上传。有意思的是,这种上传并不是
2016-06-18 22:53:51 24190 3
原创 Hadoop:Hadoop单机伪分布式的安装和配置
http://blog.csdn.net/pipisorry/article/details/51623195 之前是在docker中配置的hadoop单机伪分布式[Hadoop:Hadoop单机伪分布式的安装和配置 ],并且在docker只有root用户,所有没有权限问题存在。官方安装文档[Hadoop: Setting up a Single Node Cluster]...
2016-06-10 19:47:58 35931
原创 随机采样和随机模拟:吉布斯采样Gibbs Sampling实现高斯分布参数推断
http://blog.csdn.net/pipisorry/article/details/51539739吉布斯采样的实现问题本文主要说明如何通过吉布斯采样来采样截断多维高斯分布的参数(已知一堆截断高斯分布的数据,推断其参数( μ , Σ ))。关于吉布斯采样的介绍文章都停止在吉布斯采样的详细描述上,如随机采样和随机模拟:吉布斯采样Gibbs Sampling(why)
2016-05-30 20:08:51 11850 3
原创 随机采样和随机模拟:吉布斯采样Gibbs Sampling实现文档分类
http://blog.csdn.net/pipisorry/article/details/51525308吉布斯采样的实现问题本文主要说明如何通过吉布斯采样进行文档分类(聚类),当然更复杂的实现可以看看吉布斯采样是如何采样LDA主题分布的[主题模型TopicModel:隐含狄利克雷分布LDA]。关于吉布斯采样的介绍文章都停止在吉布斯采样的详细描述上,如随机采样和随机
2016-05-29 21:23:59 20706
原创 参数估计:文本分析的参数估计方法
http://blog.csdn.net/pipisorry/article/details/51482120文本分析的三类参数估计方法-最大似然估计MLE、最大后验概率估计MAP及贝叶斯估计。参数估计参数估计中,我们会遇到两个主要问题:(1)如何去估计参数的value。(2)估计出参数的value之后,如何去计算新的observation的概率,即进行回归分析和预测。首先定义一些符号:数据集X中
2016-05-23 17:36:47 15869 2
原创 参数估计:贝叶斯思想和贝叶斯参数估计
http://blog.csdn.net/pipisorry/article/details/51471222贝叶斯与频率派思想频率派思想 长久以来,人们对一件事情发生或不发生,只有固定的0和1,即要么发生,要么不发生,从来不会去考虑某件事情发生的概率有多大,不发生的概率又是多大。而且事情发生或不发生的概率虽然未知,但最起码是一个确定的值。比如如果问那时的人们一个问题:“有一个袋子,里面装着
2016-05-23 10:54:29 60983 7
原创 参数估计:最大似然估计MLE
http://blog.csdn.net/pipisorry/article/details/51461997最大似然估计MLE顾名思义,当然是要找到一个参数,使得L最大,为什么要使得它最大呢,因为X都发生了,即基于一个参数发生的,那么当然就得使得它发生的概率最大。最大似然估计就是要用似然函数取到最大值时的参数值作为估计值,似然函数可以写做相乘因为它们之间是独立同分布的。由于有连乘运算,通常对似然
2016-05-21 16:57:50 46519
原创 PGM:概率图模型Graphical Model
http://blog.csdn.net/pipisorry/article/details/51461878概率图模型Graphical Models简介完全通过代数计算来对更加复杂的模型进行建模和求解。然而,我们会发现,使用概率分布的图形表示进行分析很有好处。这种概率分布的图形表示被称为概率图模型( probabilistic graphical models )。这些模型提供了几个有用的性质
2016-05-21 16:57:42 25302
原创 随机采样和随机模拟:吉布斯采样Gibbs Sampling
http://blog.csdn.net/pipisorry/article/details/51373090吉布斯采样算法详解为什么要用吉布斯采样什么是sampling?sampling就是以一定的概率分布,看发生什么事件。举一个例子。甲只能E:吃饭、学习、打球,时间T:上午、下午、晚上,天气W:晴朗、刮风、下雨。现在要一个sample,这个sample可以是:打球+下午+晴朗。...
2016-05-12 00:24:21 108100 26
原创 同步图计算:GraphLite的安装和使用
http://blog.csdn.net/pipisorry/article/details/51350908linux中直接运行graphliteRequirements1. JDK 1.7.x + Hadoop 2.6.xlinux中hadoop直接安装参考[Hadoop:Hadoop单机伪分布式的安装和配置]2. protocol bufferspika:~$sudo apt-get upd
2016-05-09 11:17:14 3982
原创 Hadoop:hadoop fs、hadoop dfs与hdfs dfs命令的区别
http://blog.csdn.net/pipisorry/article/details/51340838'Hadoop DFS'和'Hadoop FS'的区别While exploring HDFS, I came across these two syntaxes for querying HDFS:> hadoop dfs> hadoop fswhy
2016-05-07 23:58:26 44258 4
原创 Hadoop:Hadoop单机伪分布式的安装和配置
http://blog.csdn.net/pipisorry/article/details/51331734本文内容:使用docker配置hadoop单机伪分布式开发环境本教程配置环境:docker (virtual box / virtual machine或者直接用ubuntu14.04都ok!,建议还是用虚拟机,docker太难搞了,没有配置的官方文件)ubuntu
2016-05-06 15:11:07 9480
原创 Docker教程:Docker镜像导出及迁移
Docker目录分析安装docker时,默认的安装位置是/var/lib/docker。$sudo ls /var/lib/docker/aufs containers graph init linkgraph.db repositories-aufstmp trust volumesrepositories-aufs:记录了镜像名称以及对应的
2016-05-06 11:36:06 63526 1
原创 Hadoop:Hadoop简介及环境配置
http://blog.csdn.net/pipisorry/article/details/51243805Hadoop简介下次写上。。。皮皮blog配置hadoop环境环境变量:$ echo $PATH/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games
2016-05-04 14:55:05 1187
原创 概率论:假设检验-t检验、卡方检验和AD-Fuller test
http://blog.csdn.net/pipisorry/article/details/51184556卡方检验 Chi-Squarethe chi-square test measures dependence between stochasticvariables, so using this function “weeds out” the features that are ...
2016-04-18 23:04:22 27540
原创 概率论:假设检验
http://blog.csdn.net/pipisorry/article/details/51182843假设检验假设检验问题分为两类,一类是参数的假设检验,一类是分布的假设检验! 设总体X的分布未知,或 X的某个分布参数 theta未知,对总体分布或分布参数 theta 提出一个假设 "H0" ,然后根据样本所提供的信息,运用统计分析的方法进行判断,从而作出是接受还是拒绝 "H0"
2016-04-18 22:10:07 12917
原创 Scipy教程 - 优化和拟合库scipy.optimize
http://blog.csdn.net/pipisorry/article/details/51106570最优化函数库Optimization优化是找到最小值或等式的数值解的问题。scipy.optimization子模块提供了函数最小值(标量或多维)、曲线拟合和寻找等式的根的有用算法。from scipy import optimize皮皮blog
2016-04-09 18:22:42 90871 1
原创 Java正则表达式
http://blog.csdn.net/pipisorry/article/details/51059500正则表达式的一般规则都一样,见[python正则表达式]java正则表达式中的特殊字符转义1.字符"|","*","+"都得加上转义字符,前面加上"\\"。2.而如果是"\",那么就得写成"\\\\"。(java正则表达式用起来都这么不爽!!!)
2016-04-04 23:25:43 1405 1
原创 numpy教程:快速傅里叶变换模块numpy.fft
http://blog.csdn.net/pipisorry/article/details/51050297快速傅里叶变换NumPy中,fft模块提供了快速傅里叶变换的功能。在这个模块中,许多函数都是成对存在的,也就是说许多函数存在对应的逆操作函数。例如,fft和ifft函数就是其中的一对。import numpy as npfrom matplotlib.pyplot
2016-04-03 14:40:01 74288 4
原创 Java:IDEA编程示例
1 安装好idea、java和gradle工具[2 idea中新建gradle项目,如test3 修改文件build.gradle模版 或者 copy某个其它项目的build.gradle去除没用配置。plugins {id 'java'Note: 在新增库时,在dependencies里面粘贴。
2016-04-03 14:35:00 1096 1
原创 矩阵论:向量范数和矩阵范数
http://blog.csdn.net/pipisorry/article/details/51030563向量范数0-范数,向量中非零元素的个数。1-范数:,即向量元素绝对值之和,matlab调用函数norm(x, 1) 。2-范数:,Euclid范数(欧几里得范数,常用计算向量长度),即向量元素绝对值的平方和再开方,matlab调用函数norm(x, 2)。∞-范数:,即所有向量元素绝对值中
2016-03-31 21:55:58 10329 1
原创 PRML笔记:模式识别与机器学习
http://blog.csdn.net/pipisorry/article/details/51011724统计学习方法-李航(适合快速入门)。PRML: Pattern Recognition and Machine learning 机器学习和模型识别的必读书。[PRML笔记-Notes on Pattern Recognition and Machine Learning.pdf][知乎p
2016-03-30 10:15:37 3023
原创 spark概念、编程模型和模块概述
http://blog.csdn.net/pipisorry/article/details/50931274spark基本概念Spark一种与 Hadoop 相似的通用的集群计算框架,通过将大量数据集计算任务分配到多台计算机上,在性能和迭代计算上很有看点,提供高效内存计算,现在是Apache孵化的顶级项目。Spark 由加州大学伯克利分校 AMP 实验室 (Algorithms, Machine
2016-03-19 15:34:33 4290
原创 Spark安装和配置
http://blog.csdn.net/pipisorry/article/details/50924395安装HadoopSpark默认使用HDFS充当持久化层,所以需要安装Hadoop,当然也可以不安装。最好下载和spark对应的版本。spark单机环境安装{linux下的安装,windows上也类似}安装jdk依赖[java环境配置:安装jdk]下载spark相应hadoop2.*版本选择
2016-03-18 16:06:17 20646 1
原创 Linux实用小工具
http://blog.csdn.net/pipisorry/article/details/50923957cloc代码行数统计工具cloc也可以用来统计源代码的行数, 其本质是一个perl的脚本sudo apt-get install -y cloc进入到需要统计的目录执行cloc .查看其源代码的信息 cat `which cloc`皮皮blog linu...
2016-03-18 15:42:42 2125
原创 Docker教程:docker machine的配置和命令
基本使用查看当前的machine:docker-machine ls创建一个dockermachine:docker-machine create --driver virtualbox test更改环境变量,使得本地docker指向docker-machine,需要执行命令:eval "$(docker-machine env dev)"创
2016-03-18 10:47:03 43467 1
原创 Docker教程:dokcer machine的概念和安装
http://blog.csdn.net/pipisorry/article/details/50920982Docker machine介绍Docker Machine is a tool that lets you install Docker Engine on virtual hosts, and manage the hosts with docker-machine com
2016-03-18 10:19:13 9809
原创 Docker教程:docker远程repository和自建本地registry
Docker有一个类似版本管理仓库(Repositry)的东西,有docker.io提供的官方仓库(index.docker.io,相当于github),也可以自建(叫docker-registry,相当于自己搭建一个小型github)。比较 Docker 和 Git:镜像管理设计理念
2016-03-06 17:29:24 19927
原创 Docker教程:使用docker配置python开发环境
http://blog.csdn.net/pipisorry/article/details/50808034Docker基本知识和安装[Docker使用教程]皮皮blogDocker开发环境配置Docker下配置python开发环境在docker官网创建并激活一个Docker账户,以便我们能使用Docker Hub,Docker Hub是Docker的
2016-03-05 11:51:15 54567 1
原创 Docker教程:镜像构建和自动镜像构建dockerfile
http://blog.csdn.net/pipisorry/article/details/50805379Docker透过Dockerfile来记录建立Container映象文件的每一个步骤,可以将建立应用程序执行环境的过程和配置参数,完整地记录下来。开发人员和维运人员之间可以利用Dockerfile来沟通对执行环境的讨论。甚至结合版本控制服务如GitHub,可以让Dockerfile...
2016-03-04 21:05:21 24374
原创 Docker教程:dokcer的配置和命令
http://blog.csdn.net/pipisorry/article/details/50803028Docker命令查询终端运行docker命令,它会打印所有可用的命令列表及使用描述:# docker查看命令具体参数及用法: # docker run --helpDocker环境查看docker infodocker未运行时显示:FATA[0000] Get h...
2016-03-04 15:27:03 16928 1
原创 Docker教程:docker的概念及安装
http://blog.csdn.net/pipisorry/article/details/50754385Why docker对于运维来说,Docker提供了一种可移植的标准化部署过程,使得规模化、自动化、异构化的部署成为可能甚至是轻松简单的事情;而对于开发者来说,Docker提供了一种开发环境的管理方法,包括映像、构建、共享等功能。程序员在搭建开发环境时遇到的一些问题软件安装...
2016-02-27 11:21:35 11195 3
原创 todotodo
http://blog.csdn.net/pipisorry/article/details/50752792todofrom:查找算法_-柚子皮-的博客-CSDN博客ref:
2016-02-26 22:18:15 1241
原创 HMM:隐马尔科夫模型 - 预测和解码
http://blog.csdn.net/pipisorry/article/details/50731584观察序列生成计算观察序列的概率(Finding the probability of an observed sequence) 给定隐马尔科夫模型,也就是在模型参数(pi, A, B)已知的情况下,我们想找到观察序列的概率。还是考虑天气这个例子,我们有一个用来描述天气及与它...
2016-02-24 16:09:28 5242
原创 HMM:隐马尔科夫模型 - 学习
http://blog.csdn.net/pipisorry/article/details/50722376隐马尔科夫模型的三个问题例子举个常见的例子来引出下文,同时方便大家理解!比如我在不同天气状态下去做一些事情的概率不同,天气状态集合为{下雨,阴天,晴天},事情集合为{宅着,自习,游玩}。假如我们已经有了转移概率和输出概率,即P(天气A|天气B)和P(事情a|天气A)的概率都已知...
2016-02-23 13:22:50 4469 1
原创 HMM:隐马尔可夫模型 - 表示
http://blog.csdn.net/pipisorry/article/details/50722178隐马尔可夫模型Hidden Markov Models 隐马尔可夫模型(Hidden Markov Models, HMM)描述由一个隐藏的马尔可夫链随机生成的不可观测的状态序列,再由各个状态生成一个观测而产生观测随机序列的过程,属于生成模型。HMM(隐马尔可夫模型)...
2016-02-23 12:37:53 26424
Parameter estimation for text analysis
2016-05-23
pdfstudio安装文件及破解
2016-03-24
matplotlib安装包
2016-01-02
pandas安装文件
2016-01-01
matplotlib安装文件
2016-01-01
GB2UTF8.exe
2015-08-07
A First Course in Probability 第8版 Sheldon Ross
2014-10-31
wps symbol fonts
2017-02-27
Anand.Rajaraman-Mining of Massive Datasets
2016-06-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人