- 博客(20)
- 资源 (31)
- 收藏
- 关注
原创 R之组间差异的非参数检验
# t 检验# 在研究中最常见的行为就是对两个组进行比较。接受某种新药治疗的患者是否较使用某种现# 有药物的患者表现出了更大程度的改善?某种制造工艺是否较另外一种工艺制造出的不合格品# 更少?两种教学方法中哪一种更有效?如果你的结果变量是类别型的,那么可以直接使用7.3节# 中阐述的方法。这里我们将关注结果变量为连续型的组间比较,并假设其呈正态分布。# 为了阐明方法,我们将使用MA...
2017-12-27 21:18:21 8426 2
原创 R之相关性的显著性检验
p 值可以解释如下:一个很小的p 值表示,在预测变量和响应变量之间的真实关系未知的情况下,不太可能完全由于偶然而观察到预测变量和响应变量之间的强相关。因此,如果看到一个很小的p 值,就可以推断预测变量和响应变量问存在关联。如果p 值足够小,我们便拒绝零假设( reject the null hypothesis) 也就是声明X 和Y 之间存在关系。# 相关# ...
2017-12-26 19:26:01 78290
原创 R之将表转换为扁平化格式
将表转换为扁平格式table2flat<-function(mytable){ df<-as.data.frame(mytable) rows<-dim(df)[1] cols<-dim(df)[2] x<-NULL for (i in 1:rows) { for (j in 1:df$Freq[i]) { row<-df[i,c(1:(cols-1
2017-12-26 16:15:23 1093
原创 R之独立性检验
# 独立性检验# R提供了多种检验类别型变量独立性的方法。本节中描述的三种检验分别为卡方独立性检验、# Fisher精确检验和Cochran-Mantel–Haenszel检验。# 1. 卡方独立性检验# 你可以使用chisq.test()函数对二维表的行变量和列变量进行卡方独立性检验library(vcd)mytable<-xtabs(~Treatment+Improve...
2017-12-26 15:35:26 9263 1
原创 R之生成频数表
# ,我们将着眼于类别型变量的频数表和列联表,以及相应的独立性检验、相关性的# 度量、图形化展示结果的方法。我们除了使用基础安装中的函数,还将连带使用vcd包和gmodels# # 包中的函数。# 本节中的数据来自vcd包中的Arthritis数据集。这份数据来自Kock & Edward (1988),表# 示了一项风湿性关节炎新疗法的双盲临床实验的结果。library(vcd)li
2017-12-26 15:06:00 14041
原创 R之分组计算描述性统计统计量
# summary()函数提供了最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻# 辑型向量的频数统计。你可以使用第5章中的apply()函数或sapply()函数计算所选择的任意描# 述性统计量。对于sapply()函数,其使用格式为:sapple(x,FUN,options)# 其中的x是你的数据框(或矩阵),FUN为一个任意的函数。如果指定了options,它们将被传递#
2017-12-25 16:10:24 5773
原创 R之箱线图
# # 箱线图(又称盒须图)通过绘制连续型变量的五数总括,即最小值、下四分位数(第25百分# 位数)、中位数(第50百分位数)、上四分位数(第75百分位数)以及最大值,描述了连续型变量# 的分布。箱线图能够显示出可能为离群点(范围±1.5*IQR以外的值,IQR表示四分位距,即上# 四分位数与下四分位数的差值)的观测。例如:boxplot(mtcars$mpg,main="Box ...
2017-12-23 20:58:31 9683
原创 R之核密度图
# # 用术语来说,核密度估计是用于估计随机变# 量概率密度函数的一种非参数方法。虽然其数学细节已经超出了本书的范畴,但从总体上讲,核# 密度图不失为一种用来观察连续型变量分布的有效方法。绘制密度图的方法(不叠加到另一幅图# 上方)为:plot(density(x))# # 其中的x是一个数值型向量。由于plot()函数会创建一幅新的图形,所以要向一# 幅已经存在的图形上叠加一条
2017-12-23 20:22:50 21015 8
原创 R之直方图
# # 直方图# 直方图通过在X 轴上将值域分割为一定数量的组,在Y 轴上显示相应值的频数,展示了连续# 型变量的分布。可以使用如下函数创建直方图:# 其中的x是一个由数据值组成的数值向量。参数freq=FALSE表示根据概率密度而不是频数绘制# 图形。参数breaks用于控制组的数量。在定义直方图中的单元时,默认将生成等距切分。par(mfrow=c(2,2))# 第一幅直方
2017-12-23 17:46:27 2155
原创 R语言之饼状图
# 饼图在商业世界中无所不在,然而多数统计学家,包括相应R文档的编写者却都对它持否定# 态度。相对于饼图,他们更推荐使用条形图或点图,因为相对于面积,人们对长度的判断更精确。# 也许由于这个原因,R中饼图的选项与其他统计软件相比十分有限。# 饼图可由以下函数创建:pie(x,labels)# 其中x是一个非负数值向量,表示每个扇形的面积,而labels则是表示各扇形标签的字符型向量。#
2017-12-23 17:11:58 13001
原创 R处理数据的案例
将学生的各科考试成绩组合为单一的成绩衡量指标、基于相对名次(前20%,下20%,等等)给出从A到F的评分、根据学生姓氏和名字的首字母对花名册进行排序代码如下:options(digits = 2)Student<-c("John Davis","Angela Williams","Bullwinkle Moose","David Jones", "Janic
2017-12-23 13:07:20 3442 2
原创 R中的字符处理函数汇总
R语言中的字符处理函数汇总请注意,函数grep()、sub()和strsplit()能够搜索某个文本字符串(fixed=TRUE)或某个正则表达式(fixed=FALSE,默认值为FALSE)。正则表达式为文本模式的匹配提供了一套清晰而简练的语法。R语言中其他实用函数:
2017-12-20 21:37:31 806
原创 R语言处理日期值的数值和字符串之间的相互转换
1 将日期的字符型转换为数值型日期值通常以字符串的形式输入到R中,然后转化为以数值形式存储的日期变量。函数as.Date()用于执行这种转化。其语法为as.Date(x, "input_format"),其中x是字符型数据,input_format则给出了用于读入日期的适当格式:举例:日期值的默认输入格式为yyyy-mm-dd。语句:mydata<-as.Dat
2017-12-09 12:19:03 31148 2
转载 R语言par(fig=)函数的详细解释
图形布局的精细控制可能有很多时候,你想通过排布或叠加若干图形来创建单幅的、有意义的图形,这需要有对图形布局的精细控制能力。你可以使用图形参数fig=完成这个任务。此上添加两幅箱线图,创建了单幅的增强型图形opar<-par(no.readonly = TRUE)par(fig=c(0,0.8,0,0.8))plot(mtcars$wt,mtcars$mpg,xlab = "
2017-12-08 11:14:37 17185 15
原创 R语言处理QQ群消息案例实现
install.packages("ggplot2")user.time<-data$timeuser.time<-as.character(user.time)user.time.h<-c()for(i in 1:length(user.time)){ user.time.h[i]<-substr(user.time[i],12,19)}#下面这句是提取时分秒user.ti
2017-12-06 18:30:08 665
原创 在R语言环境中设置JAVA_HOME的路径
在R语言环境中设置JRE路径解决办法: 如果没有java运行环境,则需安装对应版本的jre,如R64就需要安装jre64位的,并且要注意在系统环境变量中指定java_home 如果有java运行环境,检查你的java版本与R版本选择是否一致(要么都是32位,要么都是64位) 提示一点:jdk1.9之后不要下载,包括1.9,以下命令适用于JDK版本1.6到1.8...
2017-12-04 19:33:57 4811
转载 R语言聊天记录
R || 聊天记录分析(一)http://blog.csdn.net/qq_29737811/article/details/77248551
2017-12-04 19:24:13 577
转载 基于R语言的用户征信行为分类预测模型搭建总结
数据集:15万行数据量,11个数据维度。目标变量为是否有重大违约倾向(定义为超过90天没有还贷)建模流程:1. 缺失值处理发现数据集的数据缺失主要集中在亲属数量和月收入两个属性。其中,亲属数量却缺失属性为3000多条,且这3000多条记录中,月收入属性也同时缺失,故直接删除。对于有1万多条缺失记录的月收入,采用线性回归和多重插补填补缺失值。进行线性回归时,可能由于其他自
2017-12-03 15:34:29 1251
转载 基于R语言构建的电影评分预测模型
评分系统是一种常见的推荐系统。现在使用R语言基于协同过滤算法来构建一个电影评分预测模型。一,前提准备1.R语言包:ggplot2包(绘图), recommenderlab包, reshape包(数据处理)install.packages("recommenderlab")install.
2017-12-03 15:29:52 4250
转载 R语言中文社区历史文章整理(类型篇)
R语言中文社区历史文章整理(类型篇) R包:R语言交互式绘制杭州市地图:leafletCN包简介clickpaste包介绍igraph包快速上手jiebaR,从入门到喜欢Catterplots包,让你绘制不一样的图今天再来谈谈REmap包ggplot2你需要知道的都在这...R访问
2017-12-03 10:51:37 1219
虚拟化和云计算的概述以及视频讲解.rar
2020-07-11
定点补码一位乘法器的设计.rar
2020-07-11
阵列乘法器的设计与实现.rar
2020-07-11
阵列触发器的设计与实现.rar
2020-07-11
恢复余数法定点原码一位除法器.rar
2020-07-11
海明码生成与校验电路的设计.rar
2020-07-11
加减交替法定点原码一位除法器设计.rar
2020-07-11
相联存储器的设计与实现.rar
2020-07-11
CMI码编码器设计与实现.rar
2020-07-11
4PPM码编码器设计与实现2.rar
2020-07-11
4PPM码解码器设计与实现.rar
2020-07-11
RZI码编码器设计与实现.rar
2020-07-11
316RZI解码器的设计与实现.rar
2020-07-11
位同步时钟提取电路设计与实现.rar
2020-07-11
中断请求串行判优先电路的设计.rar
2020-07-11
用户评论情感分析数据集(细粒度)收集于(AI-challenger比赛)2018
2019-04-23
Logistic回归来预测患疝气病的马的存活问题。
2019-03-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人