
R语言
R语言学习、实战记录
Fovace
中级数据挖掘工程师
展开
-
R语言—定义数据框的列名
1.在定义数据框时,定义列名: 例如:a b df 此时数据框df中的列名分别是a、b 也可以如下:df 2.修改数据框中列的名字 如果希望修改数据框中的列名,可以使用name函数进行修改 例如:names(df) 3.修改数据框中行名修改 数据框中的行也是可以定义修原创 2017-12-15 16:47:37 · 67823 阅读 · 3 评论 -
方差、协方差、期望、相关系数等概念集合
首先说明一下,本文是本人在复习方差等相关知识的过程中,通过网络上的相关讲解,进行个人总结后得到的,并非个人原创,在此发布只是为了作为一个学习记录与大家分享。1.期望 试验中可能出现的值及其概率的乘积,即是数学期望 1)离散型 离散型随机变量的一切可能的取值Xi与对应的概率p(Xi)乘积之和称为该离散型随机变量的数学期望(若该求和绝对收敛),记为E(X)。它是简单算转载 2018-01-04 14:19:33 · 4535 阅读 · 0 评论 -
R语言 Scale函数
在我们做数据的时候,一个数据会有很多特征;比如在描述影响房价的因素,有房子面积,房间数量等。而不同的特征存在不同的量纲,为了消除量纲、数值差异等,我们就需要对数据进行中心化和标准化;那什么是中心化,什么是标准化呢?所谓中心化就是将数据减去均值后得到的,比如有一组数据(1,2,3,4,5,6,7),它的均值是4,中心化后的数据为(-3,-2,-1,0,1,2,3)而标准化则是在中心化后的原创 2018-01-05 13:59:37 · 41323 阅读 · 0 评论 -
R语言与主成分分析
1.概念介绍 主成分分析是一种降维技术,简单的说就是将数据中的多个变量,化为几个主要的变量反映原本数据中的绝大部分信息。 在工作中,我们常常遇到一些多维数据(即一组数据中存在多个变量、属性,或者说需要用多个变量、字段、属性去表示一组数据)。明显,数据中用到的维度越少,越便于我们的工作和研究。所以这时,我们就需要用到主成分分析,将原本多维的数据变化为低维数据。原创 2018-01-04 14:38:54 · 58281 阅读 · 3 评论 -
R语言基础知识1:向量、矩阵和数组
R语言作为大数据中常用到的基础软件,学习好R语言具有非常重要的作用在本部分的学习之中,我将对R语言的向量、矩阵、数组、列表、数据框等R语言常用到的数据形式做出简明扼要的总结;1.向量1.1 向量的创建...原创 2018-06-14 11:11:49 · 29461 阅读 · 0 评论 -
R语言基础知识2:列表和数据框
在上一篇文章中,我们对R语言中的向量、矩阵、数组的相关知识做了简明扼要的介绍,在这一篇中,我们将对R语言的列表和数据框等两种常用的数据结构进行学习;1.列表1)列表的创建列表可以存放多种类型的数据,比如数字型和字符型;R语言中通过list()函数来实现列表的创建,见下:2)列表的重命名在R语言中,同样通过name()命令来实现对列表中元素的重命名,如下:2.数据框1)数据框的创建数据框可以说是R语...原创 2018-06-15 10:19:49 · 1231 阅读 · 0 评论