R语言||绪论知识点

本文介绍了R语言及其在统计学中的应用,包括统计学的定义,R作为数据分析和可视化的工具,以及统计学的基本要素如总体、样本、参数与统计量的概念。此外,还讲解了变量的类型和数据的分类,如定量数据和定性数据的区分。
摘要由CSDN通过智能技术生成

绪论

什么是统计学?
根据《兰登书屋大学字典》 (The Random House College Dictionary)定义,统计学是“对用数字表示事实或数据进行收集、分类、分析以及解释的科学”。概括来说,统计学就是数据的科学。

什么是R?
R是进行统计分析、给图以及统计编程的平台,是进行统计分析的重要工具,是现今最受欢迎的数据分析和可视化软件。

统计学的基本要素
1.总体与样本

  • 总体(population):称研究对象的全体,通常用一个随机变量(例如X)表示总体。
  • 个体(individual):组成总体的每个基本单元 。
  • 抽样:从总体X中随机抽取一部分个体X1,…Xn,称X1,…,Xn为取自总体X的样本容量(sample size)为n的样本。
  • 样本(sample): 若X1,…,Xn相互独立,且每个Xi与X同分布,则称X1,…,Xn为简单随机样本(simple random sample),简称样本。

2.参数与统计量

  • 参数:是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征。
  • 统计量:是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的量。
    易混点:样本是随机的,因此,统计量是样本的函数,而不是一个统计量。
清华大学出品的R语言全套课程PPT学习课件,非常适合大学生和职场人士学习,也适合老鸟复习回顾,完全可用于自学入门,很经典好用的PPT课件哦~ (1)清华大学精品数据科学R语言全套课程PPT课件含习题(26页) 第1章 R语言绪论(1) (2)清华大学精品数据科学R语言全套课程PPT课件含习题(27页) 第2章 R语言入门 (3)清华大学精品数据科学R语言全套课程PPT课件含习题(53页) 第3章 数据模型 (4)清华大学精品数据科学R语言全套课程PPT课件含习题(15页) 第4章 数据准备 (5)清华大学精品数据科学R语言全套课程PPT课件含习题(66页) 第5章 数据可视化 (6)清华大学精品数据科学R语言全套课程PPT课件含习题(35页) 第6章 数据探索 (7)清华大学精品数据科学R语言全套课程PPT课件含习题(38页) 第7章 数据变换 (8)清华大学精品数据科学R语言全套课程PPT课件含习题(20页) 第8章 高级编程 (9)清华大学精品数据科学R语言全套课程PPT课件含习题(63页) 第9章 数据建模 (10)清华大学精品数据科学R语言全套课程PPT课件含习题(25页) 第10章 数据评估 (11)清华大学精品数据科学R语言全套课程PPT课件含习题(21页) 第11章 影响大学平均录取分数线因素分析 (12)清华大学精品数据科学R语言全套课程PPT课件含习题(18页) 第12章 收视率分析 (13)清华大学精品数据科学R语言全套课程PPT课件含习题(18页) 第13章 RHadoop (14)清华大学精品数据科学R语言全套课程PPT课件含习题(25页) 第14章 Rspark
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值