R语言 & MATLAB
文章平均质量分 91
打工人小飞
公众号:机器修行
展开
-
关于显著性检验,有你想要的!
何为显著性检验?显著性检验(significance test)作为判断两个乃至多个数据集之间是否存在差异的方法被广泛应用于各个科研领域。在统计学中,显著性检验是“统计假设检验”(Statistical hypothesis testing)的一种,显著性检验是用于检测科学实验中实验组与对照组之间是否有差异以及差异是否显著的办法。“无假设,不检验”。用更通俗的话来说就是要先对科研数据做一个假设,然后原创 2017-12-14 14:21:05 · 25945 阅读 · 1 评论 -
centos 挂载 NTFS 分区 以及 解决 linux 下 MATLAB 中文乱码问题
由于网络传输速度有限,有时候避免不了要将移动硬盘中的数据拷到服务器上。CentOS 上默认是不支持挂载 NTFS 格式的分区的,需要安装 ntfs-3g 这个程序就可以对 ntfs 分区进行读写了。下面讲解详细详细步骤。添加aliyun的epel源wget -O /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.re原创 2017-12-03 15:45:08 · 1014 阅读 · 0 评论 -
5 分钟带你弄懂 k-means 聚类
聚类与分类的区别分类:类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。属于监督学习。聚类:事先不知道数据会分为几类,通过聚类分析将数据聚合成几个群体。聚类不需要对数据进行训练和学习。属于无监督学习。关于监督学习和无监督学习,这里给一个简单的介绍:是否有监督,就看输入数据是否有标签,输入数据有标签,则为有监督学习,否则为无监督学习。更详尽的解释会在后续原创 2017-11-08 16:16:23 · 116499 阅读 · 83 评论 -
如何通俗易懂地理解皮尔逊相关系数?
要理解 Pearson 相关系数,首先要理解协方差(Covariance)。协方差表示两个变量 X,Y 间相互关系的数字特征,其计算公式为:COV(X,Y)=1n−1∑n1(Xi−X⎯⎯⎯)(Yi−Y⎯⎯⎯)COV(X,Y)=\frac{1}{n-1}\sum_1^n(X_i-\overline X)(Y_i-\overline Y)当 Y = X 时,即与方差相同。当变量 X,Y 的变化趋势一致时原创 2017-11-06 11:45:57 · 72705 阅读 · 6 评论 -
常用的数量统计量的计算及统计意义
数量统计量是只适合数量类型数据的统计量,使我们最常见的统计量。笔者之前对资料特征数的计算作了简单地介绍,详情可跳转至 资料特征数的计算,本片博客力求全面和简洁易懂。对于数量类型的数据样本 X1,X2,⋯,Xn,X_1, X_2, \cdots ,X_n ,其数量统计量定义如下:均值(Mean)X⎯⎯⎯=1n∑n1Xi\overline X = \frac{1}{n}\sum_1^nX_i 很简单原创 2017-11-02 20:20:17 · 9198 阅读 · 0 评论 -
R 语言语法快速浏览
1、自定义函数Huang <- function(n,Mean,Variance,Left_lim,Right_lim,Up_lim,Down_lim,method="Density") ###括号中为形参,"Huang"为函数名{ if(method=="Density") { set.seed(1) x <- seq(Left_lim原创 2016-07-05 22:04:17 · 889 阅读 · 0 评论 -
用命令行安装和加载R(源码)程序包
今天遇到一个问题,在R中用命令install.packages(“bigmemory”)安装“bigmemory”这个用于处理大数据的包时,出现以下警告提示:提示R版本过低,查看官网才知道,目前最新的“bigmemory”包要求R版本在3.2以上,而当前版本为3.1.3,如果为了安装这个包而去升级R版本,会大费周折,而且如果升级R版本的话,原本已经下载安装的包可能也会受影响,那么处理这个问题的办法就原创 2016-04-08 21:55:34 · 11066 阅读 · 0 评论