- 博客(17)
- 资源 (3)
- 问答 (1)
- 收藏
- 关注
原创 统计学 假设检验(Hypothesis Testing)
什么是假设检验: 通过设定一个假设, 然后通过收集数据、计算等操作来判断这个假设是否成立。假设检验的步骤:1. 设定 null hypothesis 和 alternative hypothesis2. 收集数据3. 基于收集的数据,来判断 拒绝 或者 接受 null hypothesis值得注意的是:H0 - null hypothesisH1 -
2016-06-29 08:53:46 23601 2
原创 【错误】An error has occurred, see the log files - Eclipse
1. An error has occurred, see the log files 2. Java was started but returned exit code = 1以上两个问题大多出现在, 但我们计算机上有多个 JDK, 系统默认的JDK版本和你想要使用的JDK版本不一样解决方法:1. 找到 eclipse 的根路径, 打开 eclipse.ini
2016-06-29 02:05:59 847
原创 午饭时间了解的印度 - 还在更新
先介绍下背景, 本人北美计算机背景研究生在读,正在暑假实习. 以下出现的印度小哥简称A和我的关系 (同事加上一起上课的同学. )中午有午饭时间, 我俩一起吃饭,正好趁着这个时间来片面的了解下印度. ******************************************* 正文 ***************************************
2016-06-25 03:15:28 2902
原创 统计学 Logistic Regression (逻辑回归)
( Logistic Regression )逻辑回归: 是一种因变量是categorical variable的回归模型, 通过使用logistic function估算概率来测试categorical variable 和一个或多个自变量的关系.例子: 我们想要知道 今天是否下雨, 可以通过给定几个输入参数然后判断; 松鼠是否带有瘟疫等等...note: categor
2016-06-24 23:31:22 4097
原创 在 Jboss中如何使用 WSDL 来生成客户端代码 JAVA
1. 创建一个 Dynamic Web Application2. 将 wsdl 文件 复制粘贴 到 WEB-INF 文件夹下3. 创建一个 web service client ( 创建过程和创建Dynamic WebAPP 是一样的)4. 完成, 在我们之前创建的Dynamic webapp 种的src文件夹下可以找到我们的 java 代码.
2016-06-24 01:58:49 1065
原创 统计学 决定系数(Coefficient of Determination) 和 相关系数 (Correlation of Coefficient )
在对数据进行线性回归计算之后,我们能够得出相应函数的系数, 那么我们如何知道得出的这个系数对方程结果的影响有强呢?所以我们用到了一种方法叫 coefficient of determination (决定系数) 来判断 回归方程 拟合的程度.首先我们先定义几个概念1. Sum Of Squares Due To Error 对于第i个观察点, 真实数据的Yi与估
2016-06-21 23:45:47 76581
原创 统计学 简单的线性回归(Linear Regression) - 最小二乘法 (least square method)
线性回归的作用: 当我们获得数据之后, 我们想要知道这些数据间元素的关系, 我们可以定义一个等式去描述这中关系. 这就是线性回归的作用. dependent variable: 就是要被预测的变量Independent variable: 就是用来预测的变量以下这个公式就是一个简单的线性回归的模型. beta 0 和 1 都是模型的变量epsilon 是随机变量, 作为error term. (...
2016-06-18 04:50:32 19509 4
原创 统计学 分布篇 - Uniform Probability Distribution(均匀分布)
均匀分布:分为 离散随机分布 和 连续随机分布我们这里学习连续随机分布:例子: 假设一个随机变量x表示飞机从芝加哥到纽约的飞行时间, x可以是在120 分钟到140分钟之间的任意值。 所以飞机飞行时间 在 120 ~ 140 分钟的概率是 1 / (140 - 120) = 1/20.则 pdf = 因为是连续函数, 所以求的概率也必须是一个范围内的概率,在图像上可以使
2016-06-16 10:45:18 13572
原创 统计学 分布篇 - Hypergeometric Distribution(超几何分布)
超几何分布: 是 离散随机分布的一种. 它描述的是 从 n 中 拿 k 个成功的事件的概率( 不放回, 不放回意味着该事件是非独立事件), 其中在 N 中一共有 K 个成功事件. n 为 样本数量, k 为样本中成功的概率N为 事件的总数量(population), K为 在N中 事件的总数量.note: 超几何分布和二项分布是相互对立的, 因为二项分布 处理的是独立随机事
2016-06-15 04:35:13 12966
原创 Python \x invalid escape error 和 windows 下的文件路径使用问题
背景: 在windows 下使用python 读取文件, import timedef readFileIntoList(filePath): inputFile = open(filePath,'r') print inputFile inputFile.close()if __name__ == "__main__": print "doing...
2016-06-15 02:44:42 6267
原创 统计学 分布篇 - Poisson Distribution(泊松分布)
泊松分布: 是离散随机分布的一种; 通常被使用在估算在 一段特定时间/空间内 发生事件数量的概率.使用泊松分布需要满足的前提条件:在 两个 相同大小/长度的 时间/空间内, 一个事件的发生的概率是相同的.事件发生于不发生是相互独立的\不受其他事件的发生或者不发生影响.PMF( probability Mass Function/概率质量函数)
2016-06-14 23:48:18 36892 2
原创 统计学 分布篇 - Normal/Gaussian Distribution(正太分布)
正太分布/高斯分布: 是连续概率分布的一种; 当真实的随机变量分布未知时经常使用它作为假设分布.若随机变量X服从 平均值 {\displaystyle \mu }. 标准差 Sigma, 则记做: {\displaystyle \sigma 概率密度函数(PDF):了解什么是PDF? 了解PDF分布图示:
2016-06-14 21:54:17 7141
原创 统计学 分布篇 - Binomial Distribution(二项分布)
二项分布: 是离散概率分布的一种. 参数有N ( 独立是\非实验次数) 和p ( 每次实验成功的概率). 个人理解: 二项分布是一种 罗列了 由 实验可能产生成功的结果的 概率 所组成的 一种概率分布.概率质量函数 PMF( Probability Mass Function ): for k = 0, 1, 2, ..., n, where{\displa
2016-06-10 04:11:14 15581
原创 统计学 入门基础PDF( Probability Density Function) 和PMF ( Probability Mass Function )
PMF( 概率质量函数 ): 是对 离散随机变量 的定义. 是 离散随机变量 在各个特定取值的概率. 该函数通俗来说,就是 对于一个离散型概率事件来说, 使用这个函数来求它的各个成功事件结果的概率.PDF ( 概率密度函数 ): 是对 连续性随机变量 的定义. 与PMF不同的是 PDF 在特定点上的值并不是该点的概率, 连续随机概率事件只能求一段区域内发生事件的概率, 通过对这段区间进
2016-06-10 03:57:24 13877
原创 统计学 入门基础概念篇 Probability 概率部分 (个人笔记)
排列 \ 组合 Combination : sometimes, we want to count all of the possible ways that a single set of object can be selected without regard to the order in which they are selected. 组合就是从一堆东西里面选出一定量的元素并且
2016-06-09 02:43:39 16288
原创 从零到一 新手教程 - JAVA Spring MVC
简单明了的Spring MVC 基础教学. 该简单工程的功能流程 : 1. 打开一个 jsp 页面输入必要的信息 2. 将输入的信息存储到 obejct 中 3. 将存储在 object 中的信息传输到另一个 jsp页面并显示. 1. 建立 dynamic Web project, 并创建以下文件, 文件路径如图显示 2. 下载 jar 包
2016-06-07 04:12:01 8554 2
原创 统计学 入门基础概念篇 - Descriptive Statistics: Charts and Graphs(个人笔记)
Graphically, The center of a distribution is located at the median of the distribution.The spread of a distribution refers to the variability of the data.ShapeThe shape of a di
2016-06-01 01:02:41 5609
Hadoop_The_Definitive_Guide_Third_Edition.pdf
2015-01-08
配置网络服务器虚拟域名以及部署文件问题
2016-09-14
TA创建的收藏夹 TA关注的收藏夹
TA关注的人