自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 R语言数据处理

一、缺失值的处理任何规模的项目都可能存在缺失值,缺失值会影响数据的呈现1、检测缺失值R语言中提供了is.na()来检测缺失值是否存在sum(is.na(nhanes2)) #计算数据集nhanes2中的缺失值总数is.na(mydata)2、如何处理缺失值①直接剔除该字段rm(mydata['key1'])②分析中排除缺失值y=sum(x,na....

2019-07-29 11:48:06 461

原创 pyhton语言基础一丨数据类型和变量

1)整数例如:1002)浮点数例如:3.14153)字符串例子:'hello word'4)列表例如:【1,2,3,4】5)字典例如:【‘hello’:3】6)数组例如:array(【1,2,3】)7)长整型例如:1000000L8)布尔型例如:TRUE,FALSE9)元组例如:('ring', 1000)10)集合例如:...

2019-06-22 10:36:01 143

原创 R语言基本统计方法

很多时候我们做数据分析就是为了分析出每个变量之间的关系,并且做出相应的指导方向,落实到执行,有哪些分析方法了?一、描述性统计分析1)方法云集用summary()函数来获取描述性统计量apply()函数或sapply()函数计算所选择的任意描述性统计量函数fivenum()可返回图基五数总括(Tukey’s five-number summary,即最小值、下四分位数、中位数、上...

2019-06-21 10:47:55 4577

原创 R语言的基本图形

1)条形图barplot()函数,水平条形图则添加(horiz=TRUE)2)堆砌条形图barolot(, legend=rownames(counts))3)分组条形图(beside=TRUE)4)均值条形图先利用mean=means(order(means$x),)5)棘状图vcd包中的函数spine()绘制6)饼图pie(x,labels)a....

2019-06-20 16:56:48 455

原创 R语言中数据的高级处理

1)数值和字符的处理函数数学函数“:abx:绝对值sqrt:平方根ceiling(x):不小于x的最小整数floor(x):不大于x的最大整数trunc(x):向0的方向截取x的整数部分round(x,digits=n):将x舍入为指定的小数,其中n为小数点几位signif(x,digits=n):将x舍入为指定的有效字位数,例如3.475,digits=2,返回值...

2019-06-20 14:55:10 1043

原创 R语言中的数据管理(数据处理)

1)创建新变量利用表达式即可创建,例如+ - * /等形式例如:mydata=transfrom(mydata,sumx=x1+x2,meanx=(x1+x2)/2)2)变量的重编码定义:重编码涉及根据同一个变量和/或其他变量的现有值创建新值的过程方法:使用R语言中的一个或多个逻辑运算符,例如< <=,>,>=,!=,!x,x丨y函数within(...

2019-06-20 11:09:35 792

原创 R语言中图形中有哪些常常使用的函数?

一、用于指定符号和线条类型的参数(par()函数)pch:指定绘制该点是使用的符号(小图形)cex:指定符号(图形大小)的大小lty:指定线条类型lwd:指定线条宽度二、针对颜色相关的函数col:绘制颜色col.axis:坐标轴刻度线的颜色col.lab:坐标轴标签(也就是数字的颜色)col.main:标题颜色col.sub:副标题颜色fg:图形前景色...

2019-06-19 17:58:29 2386

原创 R语言中处理对象的实用函数有哪些?

1)length()函数对象中的元素/成分的数量2)dim(object)显示某个对象的维度3)str(object)显示某个对象的结构4)class(object)显示某个对象的类或类型5)mode(object)显示对象的模式6)names(object)显示对象中各成分的名称7)c(object,object ....)将多个对象合并入一个...

2019-06-19 16:01:27 599

原创 R语言数据集标注

目的:为了使结果更易解读,数据分析人员通常会对数据集进行标注形式:通常这种标注包括为变量名添加描述性标签以及为类别型变量中添加值标签标签类型:1)变量标签方法是将变量标签作为变量名,然后通过 位置下标来访问这个变量2)值标签factor()可为类别型变量创建值标签例子:patientdata$gender=factor(patientdata$gender,l...

2019-06-19 15:43:14 2174

原创 R语言数据结构的分类

数据集定义:指的是由数据构成的一个矩形数组数据结构的类型1)向量定义:向量是用于存储数值型、字符型或逻辑型数据的一维数组c()函数创建2)矩阵定义:矩阵是一个二维数组,只是每个元素都拥有相同的模式matrix(元素,行的维数,列的维数,byrow是按行填充还是按列填充,)函数创建3)数组定义:数组(array)与矩阵类似,但是维度可以大于2通过ar...

2019-06-19 14:51:24 380

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除