R语言:入门+数据分析+机器学习
文章平均质量分 66
R语言干货、不仅仅是统计学的角度,起始于统计学、丰富于机器学习,案例代码来相见。涉及R生态的工具和技巧,数据连接、数据预处理、探索性数据分析(EDA)、特征工程、监督学习(分类、回归)、非监督机器学习(聚类、降维)、模型评估、可视化结论,涉及众多流行的R包和数据集。
statistics.insight
9年+以上数据挖掘和数据分析经验,211财经院校统计学研究生学历,研究方向为:数据分析、商业智能、数据挖掘、机器学习、深度学习等。
展开
-
R语言data.table导入数据内容实战:把data.frame数据转化为data.table数据
R语言data.table导入数据内容实战:把data.frame数据转化为data.table数据原创 2024-10-09 13:05:19 · 177 阅读 · 0 评论 -
R语言使用caret包中的createResample函数进行机器学习数据集采样实战、数据集有放回的采样
R语言使用caret包中的createResample函数进行机器学习数据集采样实战、数据集有放回的采样原创 2024-10-09 13:04:40 · 0 阅读 · 0 评论 -
R语言中通过鞅残差分析、可视化自变量与鞅残差的关系判断指定连续变量和风险比HR值是否存在着线性趋势、Cox回归对线性条件的诊断
R语言中通过鞅残差分析、可视化自变量与鞅残差的关系判断指定连续变量和风险比HR值是否存在着线性趋势、Cox回归对线性条件的诊断原创 2024-10-09 11:25:40 · 0 阅读 · 0 评论 -
R语言使用ggpubr包的ggdotplot函数可视化水平棒棒糖图(自定义分组数据点色彩、自定义调色板、在两端添加点图的线段segments、整体排序从大到小、自定义数据点的大小、添加数值标签)
R语言使用ggpubr包的ggdotplot函数可视化水平棒棒糖图(自定义分组数据点色彩、自定义调色板、在两端添加点图的线段segments、整体排序从大到小、自定义数据点的大小、添加数值标签)原创 2024-09-25 09:28:41 · 20 阅读 · 0 评论 -
R语言使用aov函数进行单因素协方差分析实战、验证协方差分析的回归斜率是否均匀(回归斜率在每个组中都是相同的、回归斜率的均匀性检验)
R语言使用aov函数进行单因素协方差分析实战、验证协方差分析的回归斜率是否均匀(回归斜率在每个组中都是相同的、回归斜率的均匀性检验)原创 2024-09-23 13:16:31 · 129 阅读 · 0 评论 -
R语言plotly可视化实战:plotly可视化在对比条形图中添加误差条、散点图中添加误差条、线图中添加误差条
R语言plotly可视化实战:plotly可视化在对比条形图中添加误差条、散点图中添加误差条、线图中添加误差条原创 2024-09-23 13:14:56 · 21 阅读 · 0 评论 -
R语言plotly可视化实战:plotly可视化箱图、基于预先计算好的分位数、均值、中位数等统计指标可视化箱图、箱图中添加缺口、可视化均值和标准差
R语言plotly可视化实战:plotly可视化箱图、基于预先计算好的分位数、均值、中位数等统计指标可视化箱图、箱图中添加缺口、可视化均值和标准差原创 2024-09-20 08:22:54 · 23 阅读 · 0 评论 -
R语言使用ggpubr包的ggarrange函数组合多张结论图实战(水平并排组合)
R语言使用ggpubr包的ggarrange函数组合多张结论图实战(水平并排组合)原创 2024-09-19 08:54:48 · 113 阅读 · 0 评论 -
R语言使用psych包的principal函数对指定数据集进行主成分分析PCA进行数据降维实战(输入数据为相关性矩阵)、使用nfactors参数指定抽取的主成分的个数、计算主成分评分系数
R语言使用psych包的principal函数对指定数据集进行主成分分析PCA进行数据降维实战(输入数据为相关性矩阵)、使用nfactors参数指定抽取的主成分的个数、计算主成分评分系数原创 2024-09-19 08:53:30 · 27 阅读 · 0 评论 -
R语言主成分分析PCA和因子分析EFA实战、主成分(因子)个数、主成分(因子)得分、主成分(因子)旋转(正交旋转、斜交旋转)、主成分(因子)解释
R语言主成分分析PCA和因子分析EFA实战、主成分(因子)个数、主成分(因子)得分、主成分(因子)旋转(正交旋转、斜交旋转)、主成分(因子)解释原创 2024-09-18 09:36:39 · 28 阅读 · 0 评论 -
R语言时间序列数据滚动相关性分析、R语言使用zoo包中的rollapply函数计算两个时间序列数据列之间的滚动相关性、例如,计算两种商品销售额之间的3个月的滚动相关性
R语言时间序列数据滚动相关性分析、R语言使用zoo包中的rollapply函数计算两个时间序列数据列之间的滚动相关性、例如,计算两种商品销售额之间的3个月的滚动相关性原创 2024-09-14 08:40:47 · 174 阅读 · 0 评论 -
R语言使用ggplot2包使用geom_boxplot函数绘制基础分组箱图(配置数据点抖动显示jitter)实战
R语言使用ggplot2包使用geom_boxplot函数绘制基础分组箱图(配置数据点抖动显示jitter)实战原创 2024-09-14 08:40:14 · 44 阅读 · 0 评论 -
R语言使用GGally包的ggpairs函数可视化变量相关性分析图实战:包含散点图、密度图、柱状图、箱图等、并自定义数据点的大小
R语言使用GGally包的ggpairs函数可视化变量相关性分析图实战:包含散点图、密度图、柱状图、箱图等、并自定义数据点的大小原创 2024-09-13 08:55:35 · 47 阅读 · 0 评论 -
R语言ggplot2可视化实战:使用热力图可视化dataframe数据、自定义设置热力图的颜色、自定添加标题、轴标签、热力图线框等
R语言ggplot2可视化实战:使用热力图可视化dataframe数据、自定义设置热力图的颜色、自定添加标题、轴标签、热力图线框等原创 2024-09-13 08:54:32 · 41 阅读 · 0 评论 -
R语言使用caret包构建神经网络模型(Neural Network )构建回归模型实战、通过method参数指定算法名称
R语言使用caret包构建神经网络模型(Neural Network)构建回归模型实战、通过method参数指定算法名称原创 2024-09-13 08:53:58 · 30 阅读 · 0 评论 -
R语言ggplot2可视化实战:可视化所有日期不同时段任务的持续时间、将持续时间绘制成一条线(起始时间到结束时间),y轴表示活动发生的日期,x轴表示以小时为单位的时间
R语言ggplot2可视化实战:可视化所有日期不同时段任务的持续时间、将持续时间绘制成一条线(起始时间到结束时间),y轴表示活动发生的日期,x轴表示以小时为单位的时间原创 2024-09-11 11:01:55 · 87 阅读 · 0 评论 -
R语言计算曼哈顿距离实战:计算两个向量的曼哈顿距离、dist函数计算矩阵中两两元素的曼哈顿距离
R语言计算曼哈顿距离实战:计算两个向量的曼哈顿距离、dist函数计算矩阵中两两元素的曼哈顿距离原创 2024-09-11 11:00:50 · 33 阅读 · 0 评论 -
R语言ggplot2可视化分面图(facet_wrap)实战、使用size参数自定义设置分面图标签栏(灰色标签栏)中的标签文本的字体大小
R语言ggplot2可视化分面图(facet_wrap)实战、使用size参数自定义设置分面图标签栏(灰色标签栏)中的标签文本的字体大小原创 2024-09-11 11:00:22 · 38 阅读 · 0 评论 -
R语言ggplot2可视化分面图(facet_grid)实战、自定义缩小分面图标签栏的高度、但是不改变标签栏标签文本的大小、通过element_text函数的margin参数设置实现
R语言ggplot2可视化分面图(facet_grid)实战、自定义缩小分面图标签栏的高度、但是不改变标签栏标签文本的大小、通过element_text函数的margin参数设置实现原创 2024-09-11 10:59:49 · 39 阅读 · 0 评论 -
R语言使用table1包绘制(生成)三线表实战、使用单变量分列构建三线表、设置transpose参数转置三线表、变量作为列,子组(strata)作为行
R语言使用table1包绘制(生成)三线表实战、使用单变量分列构建三线表、设置transpose参数转置三线表、变量作为列,子组(strata)作为行原创 2024-09-10 08:42:24 · 137 阅读 · 0 评论 -
R语言使用ggplot2包geom_jitter()函数绘制分组(strip plot,一维散点图)带状图(配置显示的分组)实战
R语言使用ggplot2包geom_jitter()函数绘制分组(strip plot,一维散点图)带状图(配置显示的分组)实战原创 2024-09-10 08:41:05 · 32 阅读 · 0 评论 -
R语言使用party包中的ctree函数构建条件推理决策树、使用plot函数可视化训练好的条件推理决策树、条件推理决策树的叶子节点的阴影区域表示的是阳性样本的比例
R语言使用party包中的ctree函数构建条件推理决策树、使用plot函数可视化训练好的条件推理决策树、条件推理决策树的叶子节点的阴影区域表示的是阳性样本的比例原创 2024-09-05 09:21:04 · 215 阅读 · 0 评论 -
R语言编写自定义K折交叉验证(k-fold crossValidation)函数实战、使用使用bootstrap包中的crossval函数来交叉验证模型的R方指标、验证模型的效能的可靠性和稳定性
R语言编写自定义K折交叉验证(k-fold crossValidation)函数实战、使用使用bootstrap包中的crossval函数来交叉验证模型的R方指标、验证模型的效能的可靠性和稳定性原创 2024-09-05 09:18:24 · 33 阅读 · 0 评论 -
R语言机器学习Caret包实战(Caret包是分类和回归训练的简称)、数据划分、数据预处理、模型构建、模型调优、模型评估、多模型对比、模型预测推理
R语言机器学习Caret包实战(Caret包是分类和回归训练的简称)、数据划分、数据预处理、模型构建、模型调优、模型评估、多模型对比、模型预测推理原创 2024-09-04 14:05:08 · 52 阅读 · 0 评论 -
R语言ggplot2可视化水平条形图实战(horizontal bar plot)并且在条形图的条形上添加数值标签
R语言ggplot2可视化水平条形图实战(horizontal bar plot)并且在条形图的条形上添加数值标签原创 2024-09-04 11:05:16 · 32 阅读 · 0 评论 -
R语言使用psych包的fa函数对指定数据集进行因子分析(输入数据为相关性矩阵)、使用rotate参数指定进行斜交旋转提取因子、使用fa.diagram函数可视化斜交旋转因子分析、并解读可视化图形
R语言使用psych包的fa函数对指定数据集进行因子分析(输入数据为相关性矩阵)、使用rotate参数指定进行斜交旋转提取因子、使用fa.diagram函数可视化斜交旋转因子分析、并解读可视化图形原创 2024-09-03 10:39:17 · 38 阅读 · 0 评论 -
R语言数据预处理实战:将指定的分类变量转化为因子变量、通过levels参数指定因子水平、通过labels参数指定因子标签
R语言数据预处理实战:将指定的分类变量转化为因子变量、通过levels参数指定因子水平、通过labels参数指定因子标签原创 2024-09-03 10:38:34 · 590 阅读 · 0 评论 -
R语言ggplot2可视化实战:ggplot2使用geom_mark_ellipse函数进行椭圆形圈定(注释)特定的数据簇或组(只为椭圆形圈定的数据集配置色彩)
R语言ggplot2可视化实战:ggplot2使用geom_mark_ellipse函数进行椭圆形圈定(注释)特定的数据簇或组(只为椭圆形圈定的数据集配置色彩)原创 2024-09-02 09:14:29 · 233 阅读 · 0 评论 -
R语言ggplot2可视化实战:可视化堆叠的直方图、在bin中的每个分组部分添加数值标签、为堆叠直方图中的每个分组部分添加数值标签
R语言ggplot2可视化实战:可视化堆叠的直方图、在bin中的每个分组部分添加数值标签、为堆叠直方图中的每个分组部分添加数值标签原创 2024-08-30 08:38:17 · 37 阅读 · 0 评论 -
R语言使用survival包的coxph函数构建cox回归模型实战、使用ggrisk包的ggrisk函数可视化Cox回归的风险评分图(风险得分图)、使用title参数自定义图例、轴标签的标题信息
R语言使用survival包的coxph函数构建cox回归模型实战、使用ggrisk包的ggrisk函数可视化Cox回归的风险评分图(风险得分图)、使用title参数自定义图例、轴标签的标题信息(基于LIRI基因数据集)原创 2024-08-29 08:58:52 · 1081 阅读 · 0 评论 -
R语言plotly可视化实战:使用plotly可视化模型预测概率值的直方图、使用分类标签为阴性和阳性样本预测概率直方图进行颜色区分
R语言plotly可视化实战:使用plotly可视化模型预测概率值的直方图、使用分类标签为阴性和阳性样本预测概率直方图进行颜色区分原创 2024-08-29 08:58:03 · 183 阅读 · 0 评论 -
R语言使用timeROC包计算存在竞争风险情况下的生存资料多时间AUC值、使用cox模型、并添加协变量、可视化存在竞争风险情况下的生存资料多时间ROC曲线
R语言使用timeROC包计算存在竞争风险情况下的生存资料多时间AUC值、使用cox模型、并添加协变量、可视化存在竞争风险情况下的生存资料多时间ROC曲线原创 2024-08-28 09:23:12 · 232 阅读 · 0 评论 -
R语言使用ggplot2包geom_jitter()函数绘制分组实战(strip plot,一维散点图)带状图(改变点的大小和形状)实战
R语言使用ggplot2包geom_jitter()函数绘制分组实战(strip plot,一维散点图)带状图(改变点的大小和形状)实战原创 2024-08-27 11:15:38 · 38 阅读 · 0 评论 -
R语言ggplot2可视化:使用purrr包的map函数基于嵌套的dataframe数据绘制多个可视化图像(包含3个子图)
R语言ggplot2可视化:使用purrr包的map函数基于嵌套的dataframe数据绘制多个可视化图像(包含3个子图)原创 2024-08-23 09:36:49 · 45 阅读 · 0 评论 -
R语言使用caret包的preProcess函数进行数据预处理实战:对所有的数据列进行主成分分析PCA
R语言使用caret包的preProcess函数进行数据预处理实战:对所有的数据列进行主成分分析PCA原创 2024-08-23 09:35:30 · 34 阅读 · 0 评论 -
R语言使用caret包中的createMultiFolds函数对机器学习数据集进行交叉验证抽样实战、返回的样本列表长度为k×times个、times为组内抽样次数
R语言使用caret包中的createMultiFolds函数对机器学习数据集进行交叉验证抽样实战、返回的样本列表长度为k×times个、times为组内抽样次数原创 2024-08-22 08:37:38 · 40 阅读 · 0 评论 -
R语言使用pairs函数可视化dataframe中两两变量之间的散点图实战、创建散点图矩阵、散点图矩阵中包含~右边的所有变量
R语言使用pairs函数可视化dataframe中两两变量之间的散点图实战、创建散点图矩阵、散点图矩阵中包含~右边的所有变量原创 2024-08-22 08:36:35 · 40 阅读 · 0 评论 -
R语言使用caret包构建xgboost模型(xgbLinear算法)构建回归模型实战、通过method参数指定算法名称、通过trainControl函数控制训练过程
R语言使用caret包构建xgboost模型(xgbLinear算法)构建回归模型实战、通过method参数指定算法名称、通过trainControl函数控制训练过程原创 2024-08-21 08:42:50 · 283 阅读 · 0 评论 -
R语言ggplot2可视化格式化轴标签:用逗号格式化ggplot2轴标签、在轴标签数值中加入符号标签(货币符号)
R语言ggplot2可视化格式化轴标签:用逗号格式化ggplot2轴标签、在轴标签数值中加入符号标签(货币符号)原创 2024-08-20 08:48:08 · 32 阅读 · 0 评论 -
R语言使用caret包的preProcess函数进行数据预处理:对所有的数据列进行BoxCox变换处理(将非正态分布数据列转换为正态分布数据、不可以处理负数)、设置method参数为BoxCox
R语言使用caret包的preProcess函数进行数据预处理:对所有的数据列进行BoxCox变换处理(将非正态分布数据列转换为正态分布数据、不可以处理负数)、设置method参数为BoxCox原创 2024-08-20 08:44:52 · 152 阅读 · 0 评论