自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 缺失值处理

在日常的统计分析中,数据缺失的现象是常见的,可能是在一场数据录入中导致数据缺失,或者是在问答中没有得到自己想要的结果等,都会造成数据的部分缺失。数据缺失的处理方式也有很多,需要我们根据实际的确实情况进行解决。当数据缺失量在整体中的占比比较小时,我们可以直接删除,但是如果该数据对结果影响较为显著,那么我们则不能删除,需要对数据进行填补。...

2022-06-10 14:18:58 587 1

原创 R语言数据处理:tidyr包学习

在R语言中,tidyr包的应用 tidyr主要提供了一个类似Excel中数据透视表 (pivottable)的功能; gather和spread函数将数据在长格式和宽格式之间相互转化,应用在比如稀疏矩阵和稠密矩阵之间的转化; separate和union方法提供了数据分组拆分、合并的功能,应用在nominal数据的转化上 R将整洁数据定义为:每个变量的数据存储在自身的列中,每个观测值的数据存储在其自身的行中。整洁数据是进行数据再加工的基础。...

2022-06-09 22:43:36 2556

原创 ggplot2:图形与艺术笔记

文章目录1 qplot()函数1.1 qplot()的基本用法1.1.1 散点图1.2 图形的基本属性1.3 几何对象1.3.1 添加平滑曲线1.3.2 平滑与非平滑的控制1.4 广义模型Loess1.5 线性模型1 qplot()函数1.1 qplot()的基本用法qplot()函数的前两个参数分表表示自变量与因变量,其中含有data可选参数,当我们指定了数据时,会在指定的数据集中寻找变量名。当我们默认不指定data的参数时,qplot()会自动建立。1.1.1 散点图与plot()函数类似,我

2022-01-21 20:09:40 468

原创 基本统计分析

文章目录1基本统计分析1.1描述性统计分析1.1.1 summary()函数1.1.2 sapply()函数1.1.3 describe()函数1.1.4 stat.desc()函数1.2 分组计算描述性统计量1.2.1 aggregate()分组1.2.2 by()函数2 结果可视化3 相关3.1 相关的类型3.2 相关性的显著性检验1基本统计分析1.1描述性统计分析在描述性统计量的计算方面,R中的选择很多。你可以使用summary()函数来获取描述性统计量。1.1.1 summary()函数#

2021-12-24 21:53:04 852

原创 Logistic回归与建模

文章目录1 Logistic回归模型1.1 模型的概念1.2 模型的建立1.3 参数的估计1.4 模型的求解1.5 模型的预测1.6 拟合优度检验1.7 计算预测正确率1 Logistic回归模型1.1 模型的概念在很多问题上,被解释的变量只有两个结果,这样的变量我们可以用虚拟变量来表示,即用0或1,也就是表示是与否的关系。1.2 模型的建立Logistic回归模型不对因变量y直接进行建模,而是对y取某个值的概率进行建模,即p{y=1|x}进行建模。这个概率的取值只有0或1两种情况。那么可以得到p

2021-12-24 15:30:11 4558

原创 一元线性回归分析与建模

一元线性回归分析一元回归分析的基本概念回归模型的建立一般包括:(1)通过某事物现,转化为具体问题;(2)确定指标变量,收集整理数据,并构建模型进行参数估计;(3)模型的检验,当模型检验不通过时,需要重新修改模型;(4)模型的应用,得出结论,运行给出决策等。基本概念通常我们要先收集与研究相关的数据的一组或者多组样本,为直观观察数据的分布规律,我们可以将收集到每组数据绘制二维数据散点图。一元回归分析的参数估计一元回归模型的参数估计一般采用极大似然法与最小二乘法,其中最常用的是最小二乘法估计。

2021-12-22 14:31:52 2160

原创 R语言数据可视化

文章目录1 R的基本命令1.1 描述性统计分析1.2 R包的安装与加载1.3 数据的创建1.4 数据框1.4.1 数据框合并1.5 数据的读取与保存1.5.1 读取外部数据1.6 随机数的生成1.7 数据抽样2 R的基本绘图函数2.1 plot()函数2.2 图形的参数与控制2.2.1 参数绘图2.2.2 图形控制2.2.3 图形的颜色2.2.4 par函数布局页面3 类别数据可视化3.1 一维表的可视化3.2 二维数据可视化3.3 3d堆积条形图3.4 独立性检验P值图3.5 马赛克图3.6 条件马赛克

2021-12-15 19:12:44 2763

原创 R语言入门笔记

文章目录1 R的基本操作1.1 R的使用1.2 R的工作界面1.3 R的依赖包2 创建数据集2.1 数据集的概念2.2 数据结构2.2.1向量2.3 矩阵2.3.1创建一个矩阵2.3.2 矩阵索引2.4 数组2.5 数据框2.6 列表2.7 文件的导入2.7.1 导入csv文件2.7.2 导入xlsx文件2.7.3 读取txt文本文件2.7.4 导入 SPSS 数据2.7.5 连接MySQL数据库数据3 图形与可视化3.1 折线图3.1.1 图形的一些参数3.1.2 修改线条与点的类型3.1.3 图形的优化

2021-12-12 18:25:53 696

原创 时间序列分析与建模

文章目录1 时间序列的分解1.1 wold分解定理1.2 Cramer分解定理1.3 确定性因素分析1.4 趋势分析1.5 趋势拟合法1.5.1 线性拟合1.5.2 曲线拟合1.6 平滑法1.6.1 移动平均法1.6.2 指数平滑法1.7 综合分析2 非平稳序列的随即分析2.1 差分运算2.1.1序列蕴含显著的线性趋势,1阶差分可以实现平稳2.1.2 序列蕴含曲线趋势,通常使用低阶差分运算就可以提取出曲线趋势的影响2.1.3 蕴含固定周期的序列2.2 ARIMA模型2.2.1 平稳性2.2.2 方差齐性2.

2021-12-09 22:47:12 4866

原创 MySQL基础学习(续)

文章目录1.查询语句1.1 内层查询1.2带有EXISTS的子查询1.3集合查询1.3.1 并操作(union)1.3.2 交操作(intersect)2 数据更新2.1 插入数据2.1.1 插入元组2.1.2 插入子查询结果2.2 修改数据2.2.1 修改某一个元组的值2.2.2 修改多个元组的值2.3 删除数据2.3.1 删除某一个元组2.3.2 删除多个元组3 视图3.1 建立视图3.2 删除视图3.3 查询视图1.查询语句1.1 内层查询找出每个学生超过他的选修课平均成绩的课程号select

2021-12-08 16:12:00 675

原创 MySQL基础学习

文章目录MySQL基础学习1 数据库基本操作2 数据的查询2.2.1数据插入2.2.2 单表查询2.2.3 order by语句2.2.4 聚集函数(aggregate functions)2.2.5 连接查询2.2.6 自身连接2.2.7 外连接2.2.8 多表连接2.2.9 IN嵌入查询MySQL基础学习1 数据库基本操作1.1 创建数据库数据库的创建格式为 : create DATABASE <数据库名称>;每个完整的语句需要英文的分号结束,否则无法识别会继续添加语句,数据库的命

2021-12-01 16:58:13 4252

原创 时间序列分析

R语言时间序列分析建模

2021-11-30 21:52:01 1974

原创 相关与回归分析

目录1.相关检验1.1spearman相关秩相关检验1.2kendall t相关检验2.回归拟合2.1数据检验2.2散点图2.3计算模型与拟合2.4模型回归诊断1.相关检验1.1spearman相关秩相关检验斯皮尔曼相关系数被定义成等级变量之间的皮尔逊相关系数。对于样本容量为n的样本,n个原始数据被转换成等级数据。 实际应用中,变量间的连结是无关紧要的,于是可以通过简单的步骤计算ρ.被观测的两个变量的等级的差值,则r为:1.2kendall t相关..

2021-11-01 20:57:24 844 1

原创 K-means聚类分析

1.K-means的原理1.1聚类分析的基本思想先随机选取K个对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。一旦全部对象都被分配了,每个聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是以下任何一个:(1) 没有(或最小数目)对象被重新分配给不同的聚类。(2)没有(或最小数目)聚类中心再发生变化。(3)误差平方和局部最小。1

2021-10-29 13:09:11 1846

原创 基于R语言的因子分析

目录1.基本理论1.1因子分析的基本思想 1.2因子分析模型1.3因子分析的基本步骤2.因子载荷求解 2.1极大似然法2.2主成分法 2.3主成分方差最大化正交因子旋转法 2.4绘制因子载荷图 2.5绘制每个学生因子得分图1.基本理论1.1因子分析的基本思想因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系...

2021-10-26 22:15:24 25144 1

原创 基于R语言的回归分析实现

目录1.一元线性模型1.1绘制散点图1.2回归参数的估计1.3回归方程的显著性检验1.4线性模型常用函数2.软件实现2.1绘制散点图2.2计算回归2.3做预测2.4残差分析2.5回归诊断分析3.多元线性模型3.1模型建立3.2代码实现3.3做预测3.4残差分析3.5回归诊断分析1.一元线性模型一元线性模型一般用于描述因变量随自变量之间的线性模型一般为:其中,表示Y随X的变化而线性变化的部分;是随机误差。1.1绘制

2021-10-24 22:20:40 10619

原创 基于R语言的主成分分析

目录1.主成分分析步骤2.常用函数1.princomp函数2.summary函数3.loadings函数4.predict函数5.screeplot函数3.代码实现1.主成分分析步骤(1)将数据标准化(2)求样本的相关系数矩阵R(3)求R的特征值以及特征向量(4)按主成分累计贡献率超过85%来确定主成分的个数K,并写出主成分表达式(5)对分析结果做统计意义和实际意义的解释2.常用函数1.princomp函数用于计算相关矩阵R做主成分

2021-10-19 22:33:14 15890 2

原创 R语言非参数检验(二)

目录1.检验假设的基本思想与步骤 1.检验思想 2.检验步骤2.检验假设的两类错误 1.第一类错误 2.第二类错误3.正态总体均值的假设检验 1.单个总体 2.两个总体 3.成对数据的t检验4.非参数检验 1. McNemar 检验2.符号检验 3.成对数据符号检验 4.wilcoxon符号...

2021-10-11 20:16:53 5610

原创 R语言COX-STUART趋势检验

我们经常需要看某项事物发展得趋势,但是从简单的可视化图表中有很难看出是递增,递减,还是大致保持不变?这就要用到我们所学到的趋势检验来解决问题。

2021-10-08 23:51:18 5290 3

原创 基于R语言的聚类分析

系统聚类法 系统聚类法中最常用的方法是最短距离法和最长距离法。 1.最短目录系统聚类法1.最短距离法计算公式2.最长距离法计算公式1.最小距离法最小距离法聚类分析运行结果结果分析 2.最大距离法最大距离法聚类分析运行结果结果分析 距离法计算公式 最短距离法是类与类之间按照公式;来计算的系统聚类法。它等于类Gp与类Gq中最邻近的两个样品的距离。2.最长距离法计算公式 ...

2021-10-03 00:01:26 6795 1

原创 R语言非参数检验(一)

目录1.符号检验给出假设: 结果分析:2. Wilcoxon 秩检验检验假设:结果分析:1.符号检验广义的符号检验是对连续变量分位点进行的检验,狭义的符号检验则是 仅针对中位数(或 0.5 分位点)进行的检验。: 样本中小于的点数 : :样本中大于的点数 ,当所有样本点都不等于时,n等于样本量;若有些样本量等于,将其剔除,n小于样本量对:的检验:例题:来源《非参数统计》第五版第二章例题2.1联合国人员在世界上66个大城市的生活花费指数(以纽约1...

2021-09-30 20:40:14 4217

原创 python图形可视化

目录1、安装所需要的库2、引入模块3、图的类型3.1、散点图3.2柱状图3.3折线图3.4函数图像1、安装所需要的库pip install numpypip install matplotlibpip install pandas2、引入模块#d导入相关库import pandas as pdimport numpy as npimport matplotlib.pyplot as plt#设置中文plt.rcParams['font.sa

2021-07-06 18:58:28 326 2

原创 利用python合并与拆分excel

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档目录一、使用步骤1.利用python将只有一个sheet的excel拆分为多个sheet的excel2.将excel拆分成多个工作薄,依然使用上面的数据表格3.合并多个excel一、使用步骤1.利用python将只有一个sheet的excel拆分为多个sheet的excel1.1,导入表格,从表格分析, 我们以支付方式为例进行拆分:1.2.代码拆分#-*- codeing = u...

2021-05-16 19:08:12 1710 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除