
R语言从入门到机器学习
文章平均质量分 70
R语言从入门到机器学习,不说废话、不仅仅是统计学的角度,起始于统计学、丰富于机器学习,案例代码来相见。涉及R生态的工具和技巧,数据连接、数据预处理、探索性数据分析(EDA)、特征工程、监督学习(分类、回归)、非监督机器学习(聚类、降维)、模型评估、可视化结论,涉及众多流行的R包和数据集。
Data+Science+Insight
毕业于中国科学院大学智能计算专业。研究方向为,数据挖掘、机器学习、深度学习等。深度参与了多项数据挖掘、计算机视觉以及自然语言处理相关项目,例如,社会计算、异常分析、聚类分析、预测分析、序列标记、语言生成、OCR、图像分类+检测+分割等。现任某茅数据科学家,负责数据科学团队的管理及项目实施。曾就职于中国信科集团,负责大数据与机器学习组的管理及项目实施。曾参与国家级医疗大数据平台机器学习项目的开发和建设、构建了完整的数据链路、特征池、模型仓库、迁移中心、数据应用、数据服务Pipeline,并与AWS team基于AWS云服务合作开发大型工业互联网项目,积累了工业互联网模型构建、部署、监控实战经验。
展开
-
R语言多因素有交互方差分析(Two-Way ANOVA):检测和理解两个因素之间的交互作用的最简单的方法是使用交互作用图、双因素交互作用图可视化(interaction plot)
R语言多因素有交互方差分析(Two-Way ANOVA):检测和理解两个因素之间的交互作用的最简单的方法是使用交互作用图、双因素交互作用图可视化(interaction plot)目录R语言多因素有交互方差分析(Two-Way ANOVA):检测和理解两个因素之间的交互作用的最简单的方法是使用交互作用图、双因素交互作用图可视化(interaction plot)#多因素有交互方差分析(Two-Way ANOVA)#双因素交互作用图(interaction plot)#仿真数据#拟原创 2021-10-18 07:08:42 · 5671 阅读 · 9 评论 -
R语言单因素方差分析(One-Way ANOVA)实战:探索性数据分析(EDA)、单因素方差分析模型结果解读(检查模型假设)、分析不同分组的差异TukeyHSD、单因素方差分析的结果总结
R语言单因素方差分析(One-Way ANOVA)实战:探索性数据分析(EDA)、单因素方差分析模型结果解读(检查模型假设)、分析不同分组的差异TukeyHSD、单因素方差分析的结果总结目录R语言单因素方差分析(One-Way ANOVA)实战:探索性数据分析(EDA)、单因素方差分析模型结果解读(检查模型假设)、分析不同分组的差异TukeyHSD、单因素方差分析的结果总结#单因素方差分析(One-Way ANOVA)#仿真数据#探索性数据分析(使用dplyr包计算不同分组的方差和均原创 2021-10-16 00:03:17 · 8647 阅读 · 9 评论 -
R语言VRPM包安装及彩色列线图绘制(nomogram)实战:基于survival包colon数据集
R语言VRPM包安装及彩色列线图绘制(nomogram)实战:基于survival包colon数据集列线图绘制(nomogram)实战目录R语言VRPM包安装及彩色列线图绘制(nomogram)实战:基于survival包colon数据集列线图绘制(nomogram)实战#VRPM包安装#找到VRPM包的文件地址手动安装#尝试添加依赖#尝试套用如下方案#尝试使用Rstudio#接着继续使用Rstudio本地安装VRPM包成功#加载包和数据集#基于dplyr包进行.原创 2021-09-27 00:03:22 · 3263 阅读 · 7 评论 -
R语言自定义编程进行决策曲线分析DCA曲线绘制(Decision Curve Analysis)
R语言自定义编程进行决策曲线分析DCA曲线绘制(Decision Curve Analysis)我们可能使用别的语言获得了机器学习模型以及对应的预测概率和标签,我们想直接使用这些信息进行DCA曲线的绘制,可是R包中默认提供的方案都是打包的方法:主要R函数及工具:decision_curve_analysisplot_decision_curveplot_clinical_impact我想要自定义怎么办????我这里有一个方案:# 输出原始数据并绘制DCA曲线(Deci.原创 2021-08-11 08:45:35 · 8579 阅读 · 4 评论 -
R语言生成期望仿真数据,适用ggpubr包绘制箱图、添加对比显著性p值、使用stat_compare_means函数指定假设检验方法、使用rremove函数移除X轴标签、移除图例
R语言生成期望仿真数据,适用ggpubr包绘制箱图、添加对比显著性p值、使用stat_compare_means函数指定假设检验方法、使用rremove函数移除X轴标签、移除图例原创 2023-10-29 09:10:04 · 90 阅读 · 0 评论 -
R语言生成期望仿真数据,适用ggpubr包绘制箱图、添加对比显著性p值、使用stat_compare_means函数指定假设检验方法
R语言生成期望仿真数据,适用ggpubr包绘制箱图、添加对比显著性p值、使用stat_compare_means函数指定假设检验方法原创 2023-10-29 09:06:34 · 70 阅读 · 0 评论 -
Error: attempt to apply non-function
Error: attempt to apply non-function原创 2023-09-16 09:33:38 · 200 阅读 · 0 评论 -
AttributeError: Can only use .dt accessor with datetimelike values
AttributeError: Can only use .dt accessor with datetimelike values目录AttributeError: Can only use .dt accessor with datetimelike values仿真数据问题:解决:完整错误:仿真数据import pandas as pd# create a dataframedf = pd.DataFrame({ "Date": ["2020..原创 2023-09-06 10:08:49 · 169 阅读 · 0 评论 -
Error in as.POSIXlt.character(x, tz, ...) : character string is not in a standard unambiguous format
Error in as.POSIXlt.character(x, tz, ...) : character string is not in a standard unambiguous format原创 2023-06-19 10:11:08 · 260 阅读 · 0 评论 -
R语言将列表list数据转化为字符串(Convert List to String in R)
R语言将列表list数据转化为字符串(Convert List to String in R)原创 2023-06-11 09:31:12 · 427 阅读 · 0 评论 -
R语言使用ggpubr包的ggboxplot函数可视化分组箱图(boxplot)并添加抖动数据点、生成符合自定义要求的仿真数据
R语言使用ggpubr包的ggboxplot函数可视化分组箱图(boxplot)并添加抖动数据点、生成符合自定义要求的仿真数据原创 2023-06-07 08:48:27 · 315 阅读 · 0 评论 -
R语言使用ggpubr包的ggboxplot函数可视化分组箱图(boxplot)并添加抖动数据点、使用rremove函数移除图例标题title
R语言使用ggpubr包的ggboxplot函数可视化分组箱图(boxplot)并添加抖动数据点、使用rremove函数移除图例标题title原创 2023-06-05 09:02:57 · 479 阅读 · 0 评论 -
R语言使用ggpubr包的ggboxplot函数可视化分组箱图(boxplot)并添加抖动数据点、使用rremove函数移除X轴标签内容
R语言使用ggpubr包的ggboxplot函数可视化分组箱图(boxplot)并添加抖动数据点、使用rremove函数移除X轴标签内容原创 2023-06-12 08:54:35 · 179 阅读 · 0 评论 -
R语言使用ggpubr包的ggboxplot函数可视化分组箱图(boxplot)并添加抖动数据点、使用stat_compare_means函数添加假设检验结果
R语言使用ggpubr包的ggboxplot函数可视化分组箱图(boxplot)并添加抖动数据点、使用stat_compare_means函数添加假设检验结果原创 2023-06-06 10:29:16 · 199 阅读 · 0 评论 -
R语言使用caret包的predict函数对模型在测试集上的表现进行推理和预测、计算模型的混淆矩阵、设置参数mode计算基于混淆矩阵产生的衍生指标(特异度、敏感度、F1、ppv、npv等)
R语言使用caret包的predict函数对模型在测试集上的表现进行推理和预测、计算模型的混淆矩阵、设置参数mode计算基于混淆矩阵产生的衍生指标(特异度、敏感度、F1、ppv、npv等)原创 2023-06-01 08:53:24 · 202 阅读 · 0 评论 -
R语言使用caret包的predict函数对模型在测试集上的表现进行推理和预测、predict函数对测试数据集进行数据预处理(和训练集的初始方式保持一致)
R语言使用caret包的predict函数对模型在测试集上的表现进行推理和预测、predict函数对测试数据集进行数据预处理(和训练集的初始方式保持一致):缺失值填充、数值变量最小最大缩放、因子变量独热编码等原创 2023-06-24 08:26:44 · 230 阅读 · 0 评论 -
R语言使用caret包的train函数构建基于遗传算法的决策树(evtree)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建基于遗传算法的决策树(evtree)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-12 08:55:47 · 179 阅读 · 0 评论 -
R语言使用caret包的train函数构超随机树模型(Random Forest by Randomization )构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构超随机树模型(Random Forest by Randomization)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-05-29 11:27:36 · 140 阅读 · 0 评论 -
R语言使用caret包的train函数构建Bagging AdaBoost 模型(Bagged AdaBoost )构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建Bagging AdaBoost模型(Bagged AdaBoost)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-05 21:24:37 · 163 阅读 · 0 评论 -
R语言使用caret包的train函数构建惩罚判别分析模型(pda)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建惩罚判别分析模型(pda)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-21 08:41:00 · 115 阅读 · 0 评论 -
R语言使用caret包的train函数构建正则化的广义线性模型(glmnet)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建正则化的广义线性模型(glmnet)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-07 08:48:48 · 162 阅读 · 1 评论 -
R语言使用caret包的train函数构建bagging抽样的cart树算法(bagged cart)构建分类模型、trainControl函数设置交叉验证参数
R语言使用caret包的train函数构建bagging抽样的cart树算法(bagged cart)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-05-30 22:44:00 · 115 阅读 · 0 评论 -
R语言使用caret包的train函数构建堆叠式自动编码器深度神经网络(dnn)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建堆叠式自动编码器深度神经网络(dnn)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-05-28 20:01:08 · 191 阅读 · 0 评论 -
R语言使用caret包的train函数构建条件推理树模型算法(ctree)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建条件推理树模型算法(ctree)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-05-31 09:08:03 · 154 阅读 · 0 评论 -
R语言使用caret包的train函数构建广义线性模型算法(glm)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建广义线性模型算法(glm)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-05-30 10:07:26 · 169 阅读 · 0 评论 -
R语言使用caret包的train函数构建随机梯度提升算法(gbm)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建随机梯度提升算法(gbm)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-18 09:58:45 · 135 阅读 · 0 评论 -
R语言使用caret包的train函数构建CART决策树(CART)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建CART决策树(CART)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-15 11:38:04 · 137 阅读 · 0 评论 -
R语言使用caret包的train函数构建多层感知机算法模型(MLP)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建多层感知机算法模型(MLP)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-22 08:34:53 · 182 阅读 · 0 评论 -
R语言使用caret包的train函数构建朴素贝叶斯模型(NB)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建朴素贝叶斯模型(NB)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-03 09:55:12 · 210 阅读 · 0 评论 -
R语言使用caret包的train函数构建KNN邻近算法模型(KNN)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建KNN邻近算法模型(KNN)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-16 08:52:46 · 197 阅读 · 0 评论 -
R语言使用caret包的train函数构建线性判别分析LDA模型(LDA)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建线性判别分析LDA模型(LDA)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-19 10:10:41 · 139 阅读 · 0 评论 -
R语言使用caret包的train函数构建多项式核SVM模型(多项式核函数)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建多项式核SVM模型(多项式核函数)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-17 11:18:57 · 160 阅读 · 0 评论 -
R语言使用caret包的train函数构建多项式核SVM模型(多项式核函数)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建多项式核SVM模型(多项式核函数)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-25 09:36:59 · 145 阅读 · 0 评论 -
R语言使用caret包的train函数构建线性核SVM模型(线性核函数)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建线性核SVM模型(线性核函数)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-26 08:49:53 · 90 阅读 · 0 评论 -
R语言使用caret包的train函数构建多项式核SVM模型(多项式核函数)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建多项式核SVM模型(多项式核函数)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-20 10:47:38 · 108 阅读 · 0 评论 -
R语言使用caret包的train函数构建自组织映射模型(SOM)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建自组织映射模型(SOM)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-27 08:41:03 · 127 阅读 · 0 评论 -
R语言使用caret包的train函数构建xgboost模型(基于gbtree算法)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建xgboost模型(基于gbtree算法)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-23 17:26:20 · 141 阅读 · 0 评论 -
R语言使用caret包的train函数构建xgboost模型(基于linear算法)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建xgboost模型(基于linear算法)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-08 09:01:56 · 178 阅读 · 0 评论 -
R语言使用caret包的train函数构建xgboost模型(基于dart算法)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建xgboost模型(基于dart算法)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-02 08:46:12 · 188 阅读 · 0 评论 -
R语言使用caret包的train函数构建多元自适应回归样条(MARS)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标
R语言使用caret包的train函数构建多元自适应回归样条(MARS)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优原创 2023-06-10 11:12:07 · 144 阅读 · 0 评论