自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

data+scenario+science+insight

data+scenario+science+insight

  • 博客(4520)
  • 资源 (55)
  • 收藏
  • 关注

原创 R语言使用caret包的train函数构建xgboost模型(基于linear算法)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标

R语言使用caret包的train函数构建xgboost模型(基于linear算法)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优

2023-06-08 09:01:56 7

原创 python使用filestools包批量给指定文件夹下的图像文件添加自定义水印:color参数指定水印文本内容的颜色

python使用filestools包批量给指定文件夹下的图像文件添加自定义水印:color参数指定水印文本内容的颜色

2023-06-08 08:59:56 8

原创 R语言使用caret包的train函数构建正则化的广义线性模型(glmnet)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标

R语言使用caret包的train函数构建正则化的广义线性模型(glmnet)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优

2023-06-07 08:48:48 16 1

原创 R语言使用ggpubr包的ggboxplot函数可视化分组箱图(boxplot)并添加抖动数据点、生成符合自定义要求的仿真数据

R语言使用ggpubr包的ggboxplot函数可视化分组箱图(boxplot)并添加抖动数据点、生成符合自定义要求的仿真数据

2023-06-07 08:48:27 4

原创 R语言使用caret包的preProcess函数进行数据填充、使用Bagging树集成算法进行缺失值填充

R语言使用caret包的preProcess函数进行数据填充、使用Bagging树集成算法进行缺失值填充

2023-06-06 10:31:14 16 1

原创 R语言使用ggpubr包的ggboxplot函数可视化分组箱图(boxplot)并添加抖动数据点、使用stat_compare_means函数添加假设检验结果

R语言使用ggpubr包的ggboxplot函数可视化分组箱图(boxplot)并添加抖动数据点、使用stat_compare_means函数添加假设检验结果

2023-06-06 10:29:16 7

原创 R语言使用caret包的train函数构建Bagging AdaBoost 模型(Bagged AdaBoost )构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标

R语言使用caret包的train函数构建Bagging AdaBoost模型(Bagged AdaBoost)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优

2023-06-05 21:24:37 6

原创 R语言使用ggpubr包的ggboxplot函数可视化分组箱图(boxplot)并添加抖动数据点、使用rremove函数移除图例标题title

R语言使用ggpubr包的ggboxplot函数可视化分组箱图(boxplot)并添加抖动数据点、使用rremove函数移除图例标题title

2023-06-05 09:02:57 8

原创 python使用filestools包批量给指定文件夹下的图像文件添加自定义水印:opacity参数指定水印文本内容的透明度

python使用filestools包批量给指定文件夹下的图像文件添加自定义水印:opacity参数指定水印文本内容的透明度

2023-06-05 09:01:44 11

原创 R语言summary函数:使用summary函数计算数据对象的描述性统计信息、计算向量(vector、dataframe)的描述性统计信息、计算机器学习模型的描述性统计信息(回归系数,标准误差,p值等

R语言summary函数:使用summary函数计算数据对象的描述性统计信息、summary函数计算向量(vector)的描述性统计信息、summary函数计算dataframe所有数据列的描述性统计信息、summary函数计算机器学习模型的描述性统计信息(回归系数,标准误差,p-值,显著性水平,截距,r方和f统计量)

2023-06-04 10:00:04 12

原创 Warning message:In sqrt() : NaNs produced

Warning message:In sqrt() : NaNs produced

2023-06-04 09:58:02 13

原创 R语言gganimate包创建可视化gif动图、可视化动图:创建动态散点图动画基于transition_time函数、使用view_follow函数让动画图跟随每一帧中的数据进行变动和调整

R语言gganimate包创建可视化gif动图、可视化动图:创建动态散点图动画基于transition_time函数、使用view_follow函数让动画图跟随每一帧中的数据进行变动和调整

2023-06-03 09:57:41 24

原创 R语言使用caret包的train函数构建朴素贝叶斯模型(NB)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标

R语言使用caret包的train函数构建朴素贝叶斯模型(NB)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优

2023-06-03 09:55:12 22

原创 R语言可视化分面图、多变量分组嵌套多水平t检验、可视化多变量分组嵌套多水平分面箱图(faceting boxplot)并添加显著性水平

R语言可视化分面图、多变量分组嵌套多水平t检验、可视化多变量分组嵌套多水平分面箱图(faceting boxplot)并添加显著性水平

2023-06-02 08:46:53 16 1

原创 R语言使用caret包的train函数构建xgboost模型(基于dart算法)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标

R语言使用caret包的train函数构建xgboost模型(基于dart算法)模型构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优

2023-06-02 08:46:12 15

原创 R语言使用caret包的predict函数对模型在测试集上的表现进行推理和预测、计算模型的混淆矩阵、设置参数mode计算基于混淆矩阵产生的衍生指标(特异度、敏感度、F1、ppv、npv等)

R语言使用caret包的predict函数对模型在测试集上的表现进行推理和预测、计算模型的混淆矩阵、设置参数mode计算基于混淆矩阵产生的衍生指标(特异度、敏感度、F1、ppv、npv等)

2023-06-01 08:53:24 40

原创 R语言使用yardstick包的roc_curve函数评估二分类(binary)模型的性能、并使用autoplot函数可视化模型的ROC曲线(roc curve)

R语言使用yardstick包的roc_curve函数评估二分类(binary)模型的性能、并使用autoplot函数可视化模型的ROC曲线(roc curve)

2023-06-01 08:52:19 8

原创 R语言使用smoothScatter函数可视化散点图、应对数据量太大、且有数据重叠的情况、普通散点图可视化效果变差的情况、smoothScatter函数使用核密度估计来生成散点图的平滑颜色密度表示

R语言使用smoothScatter函数可视化散点图、应对数据量太大、且有数据重叠的情况、普通散点图可视化效果变差的情况、smoothScatter函数使用核密度估计来生成散点图的平滑颜色密度表示

2023-05-31 22:06:46 13

原创 R语言可视化时间序列数据(time series)、并使用geomtextpath包的geom_textsmooth函数在时间序列需要标注的区域设置趋势文本标签

R语言可视化时间序列数据(time series)、并使用geomtextpath包的geom_textsmooth函数在时间序列需要标注的区域设置趋势文本标签

2023-05-31 09:09:02 18

原创 R语言使用caret包的train函数构建条件推理树模型算法(ctree)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标

R语言使用caret包的train函数构建条件推理树模型算法(ctree)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优

2023-05-31 09:08:03 18

原创 R语言使用caret包的train函数构建bagging抽样的cart树算法(bagged cart)构建分类模型、trainControl函数设置交叉验证参数

R语言使用caret包的train函数构建bagging抽样的cart树算法(bagged cart)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优

2023-05-30 22:44:00 21

原创 R语言使用caret包的train函数构建广义线性模型算法(glm)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标

R语言使用caret包的train函数构建广义线性模型算法(glm)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优

2023-05-30 10:07:26 18

原创 R语言使用ggpubr包ggsummarystats函数可视化分组箱图并在X轴标签下方添加分组对应的统计值(样本数N、中位数median、四分位数的间距iqr)

R语言使用ggpubr包ggsummarystats函数可视化分组箱图并在X轴标签下方添加分组对应的统计值(样本数N、中位数median、四分位数的间距iqr)Basic box plots with add summary statistics

2023-05-30 10:07:04 8

原创 R语言使用caret包的train函数构超随机树模型(Random Forest by Randomization )构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标

R语言使用caret包的train函数构超随机树模型(Random Forest by Randomization)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优

2023-05-29 11:27:36 23

原创 R语言使用caret包的train函数构建堆叠式自动编码器深度神经网络(dnn)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标

R语言使用caret包的train函数构建堆叠式自动编码器深度神经网络(dnn)构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标、tuneLength参数和tuneGrid参数超参数调优

2023-05-28 20:01:08 30

原创 R语言ggplot2可视化:图例放置在图像内部的指定区域、自定义缩放图例中点形状pch的大小、自定义缩放图例中颜色标识标签大小、自定义缩放图例中字体大小

R语言ggplot2可视化:图例放置在图像内部的指定区域、自定义缩放图例中点形状pch的大小、自定义缩放图例中颜色标识标签大小、自定义缩放图例中字体大小、自定义函数自定义ggplot图像中的图例(legend)的位置、图例标题、键值、文本字体大小(title、text、key)、颜色标识的大小、点形状pch的大小

2023-05-28 09:32:50 12

原创 R语言使用DALEX包的model_profile函数基于偏依赖PDP方法解释多个分类模型中某个连续特征和目标值y的关系(Partial Dependence Plots)

R语言使用DALEX包的model_profile函数基于偏依赖PDP方法解释多个分类模型中某个连续特征和目标值y的关系(Partial Dependence Plots)

2023-05-28 09:31:27 18

原创 R语言使用yardstick包的conf_mat函数计算二分类(binary)模型的混淆矩阵(confusion matrix)、并使用autoplot函数可视化混淆矩阵的结果(heatmap形式绘制

R语言使用yardstick包的conf_mat函数计算二分类(binary)模型的混淆矩阵(confusion matrix)、并使用autoplot函数可视化混淆矩阵的结果(设置图像类型为heatmap)

2023-05-27 11:54:09 11

原创 R语言ggplot2可视化散点图并添加每个分组的拟合曲线(geom_smooth)、R语言ggplot2可视化分面图(faceting、facet_wrap)、在每个分面图中添加每个分组的拟合曲线

R语言ggplot2可视化散点图并添加每个分组的拟合曲线(geom_smooth)、R语言ggplot2可视化分面图(faceting、facet_wrap)、在每个分面图中添加每个分组的拟合曲线(geom_smooth)

2023-05-27 11:53:50 21

原创 R语言ggpubr包ggsummarystats函数可视化多变量分组分面(faceting)箱图(分组颜色、jitter)并在每个图X轴标签下方添加多变量分组分面对应的统计值(样本数、中位数、iqr)

R语言ggpubr包ggsummarystats函数可视化多变量分组分面(faceting boxplot)箱图(自定义多变量分组颜色、添加抖动数据点jitter)并在每个分组分面X轴标签下方添加多变量分组分面对应的统计值(样本数N、中位数median、四分位数的间距iqr、统计值的色彩和多变量分组分面图色彩相匹配)(Create panels according to two grouping variables)

2023-05-26 20:24:29 17

原创 pandas使用read_csv函数读取csv数据、header参数指定作为列索引的行索引列表形成复合(多层)列索引、columns.names属性为列索引指定、设置名称

pandas使用read_csv函数读取csv数据、index_col参数指定作为行索引的数据列索引列表形成复合(多层)行索引、header参数指定作为列索引的行索引列表形成复合(多层)列索引、columns.names属性为列索引指定、设置名称

2023-05-26 20:23:44 18

原创 R语言使用yardstick包的conf_mat函数计算多分类(Multiclass)模型的混淆矩阵(confusion matrix)、并使用autoplot函数可视化混淆矩阵的结果heatmap

R语言使用yardstick包的conf_mat函数计算多分类(Multiclass)模型的混淆矩阵(confusion matrix)、并使用autoplot函数可视化混淆矩阵的结果(设置图像类型为heatmap)

2023-05-25 23:13:39 13

原创 pandas读取csv数据、参数指定作为行索引的数据列索引列表形成复合(多层)行索引、使用iloc基于行索引位置范围和列索引位置范围筛选dataframe数据(指定起始位置和结束位置)

pandas使用read_csv函数读取csv数据、index_col参数指定作为行索引的数据列索引列表形成复合(多层)行索引、header参数指定作为列索引的行索引列表形成复合(多层)列索引、使用iloc基于行索引位置范围和列索引位置范围筛选dataframe数据(指定起始位置和结束位置)

2023-05-25 23:12:47 17

原创 R语言将原dataframe基于是否为缺失值(NA)转化为布尔型dataframe(Convert Dataframe to a Boolean Dataframe based on NAs)

R语言将原dataframe基于是否为缺失值(NA)转化为布尔型dataframe(Convert Dataframe to a Boolean Dataframe based on NAs)

2023-05-25 00:32:30 18

原创 R语言使用plotly可视化分面图散点图(faceting、facet_warp)、使用ggplot2可视化分面图、使用ggplotly将ggplot2可视化结果封装为plotly可视化结果

R语言使用plotly可视化分面图散点图(faceting、facet_warp)、使用ggplot2可视化分面图、使用ggplotly将ggplot2可视化结果封装为plotly可视化结果

2023-05-25 00:31:44 12

原创 R语言使用ggplotly包将ggplot2可视化图像转化为plotly图像、并设置删除plotly可视化结果的选项条(remove option bar)

R语言使用ggplotly包将ggplot2可视化图像转化为plotly图像、并设置删除plotly可视化结果的选项条(remove option bar)

2023-05-23 09:53:17 25

原创 R语言ggplot2可视化:分组条形图(side by side bars)并添加误差线(error bar)、合理配置分组的距离

R语言ggplot2可视化:分组条形图(side by side bars)并添加误差线(error bar)、合理配置分组的距离

2023-05-23 09:52:51 21

原创 R语言dataframe列数据筛选、基于索引筛选数据列、基于字段名称筛选数据列(Selecting variables)、列数据反选、基于索引、基于逻辑符、基于NULL符号(excluding)

R语言dataframe列数据筛选、基于索引筛选数据列、基于字段名称筛选数据列(Selecting (keeping) variables)、列数据反选、基于索引、基于逻辑符、基于NULL符号(Excluding (dropping) variables)

2023-05-22 10:10:13 39

原创 R语言ggplot2进行特定国家或者地区的地图可视化、使用多个geom_sf函数将一个地图覆盖在另一个地图上形成组合层次地图(Layered maps)

R语言ggplot2进行特定国家或者地区的地图可视化、使用多个geom_sf函数将一个地图覆盖在另一个地图上形成组合层次地图(Layered maps)

2023-05-22 10:09:56 26

原创 R语言ggpubr包ggsummarystats函数可视化分组箱图(自定义分组颜色、添加抖动数据点jitter)并在X轴标签下方添加分组对应的统计值:样本数N、中位数median、四分位数的间距iqr

R语言ggpubr包ggsummarystats函数可视化分组箱图(自定义分组颜色、添加抖动数据点jitter)并在X轴标签下方添加分组对应的统计值(样本数N、中位数median、四分位数的间距iqr、统计值的色彩和分组图色彩相匹配)Basic box plots with add summary statistics

2023-05-21 09:23:21 15

orange-juice-withmissing.csv

orange_juice_withmissing.csv 原来在ISLR包中提供的橙汁(orange)数据的修改版本。这个数据集的目标是预测顾客购买了两个品牌的橙汁中的哪一个。预测变量是客户和产品本身的特征。它包含1070行18列。响应变量是'purche',它取值为'ch'(柑橘山)或'mm'(美汁源)。 博主博客中、Caret包练习中使用的数据集。 Caret包是分类和回归训练的简称(Caret is short for Classification And REgression Training)。它在一个精简的工作流程中集成了所有与模型开发相关的步骤

2022-12-02

lweight.sav

lweight.sav

2021-07-26

object detection survey deep learning part.pdf

object detection survey deep learning part.pdf

2021-06-07

DetectoRS.pdf

DetectoRS.pdf

2021-06-07

SPSS基本统计分析功能.pdf

SPSS基本统计分析功能.pdf

2021-06-07

SPSS 数据文件的操作.pdf

SPSS 数据文件的操作.pdf

2021-06-07

Prediction of hospitalization due to heart diseases

Prediction of hospitalization due to heart diseases by supervised learning methods.pdf

2021-06-07

Prediction of future gastric cancer risk

Prediction of future gastric cancer risk using a machine learning algorithm and comprehensive medical check-up data A case-control study.pdf

2021-06-07

Identification of clusters of rapid and slow decliners

Identification of clusters of rapid and slow decliners among subjects at risk for Alzheimer’s disease.pdf

2021-06-07

Disease Prediction by Machine Learning Over big data

Disease Prediction by Machine Learning Over big data from health communities.pdf

2021-06-07

Deep Learning Algorithm for Prognostication

Development and External Validation of a Deep Learning Algorithm for Prognostication of Cardiovascular Outcomes.pdf

2021-06-07

Cox Proportional Hazard Regression

Cox Proportional Hazard Regression Versus a Deep Learning Algorithm in the Prediction of Dementia An Analysis Based on Periodic Health Examination.pdf

2021-06-07

Comparing different machine learning algorithms for disease prediction.pdf

Comparing different supervised machine learning algorithms for disease prediction

2021-06-07

Chronic Kidney Disease Prediction.pdf

Chronic Kidney Disease Prediction.pdf

2021-06-07

Chronic Disease Prediction Using Medical Notes.pdf

Chronic Disease Prediction Using Medical Notes.pdf

2021-06-07

真实世界研究指南2018.pdf

真实世界研究指南2018.pdf

2021-06-07

第16章偏态分布的激素水平影响因素分析.ppt

第16章偏态分布的激素水平影响因素分析.ppt

2021-06-07

中科大苏淳教授:漫话概率论ppt.pdf

中科大苏淳教授:漫话概率论ppt.pdf

2021-06-07

titanic.xls

泰坦尼克号机器学习数据集:titanic.xls

2021-06-07

传感器原理及应用+赵静PPT.zip

传感器原理及应用+赵静PPT.zip

2021-06-07

Why_Graph.pdf

Why_Graph.pdf

2021-06-06

Matrix CookBook.pdf

Matrix CookBook.pdf

2021-06-06

Taming Text.pdf

Taming Text.pdf

2021-06-06

Writing_and_Publishing_Science_Research_Papers_in_English.pdf

Writing_and_Publishing_Science_Research_Papers_in_English

2021-06-06

Top 200 Data Engineer Interview Questions & Answers.epub

Top 200 Data Engineer Interview Questions & Answers.epub

2021-06-06

google interview.epub

google interview

2021-06-06

Data Structures & Algorithms Interview Questions.pdf

Data Structures & Algorithms Interview Questions

2021-06-06

成都理工大学+试题+解答.rar

成都理工大学+试题+解答.rar

2021-06-06

传感器原理与检测技术(陈杰).rar

传感器原理与检测技术(陈杰)

2021-06-06

传感器习题解答(郁有文2版)1、2、3、7、8、9、10、11、12、14、15章.rar

传感器习题解答(郁有文2版)

2021-06-06

KPCB 公司投资互联网产业大获其利.pdf

KPCB 公司投资互联网产业大获其利.pdf

2021-06-06

Glucose_LSTM.ipynb

使用LSTM进行血糖预测并使用MLFLOW进行模型管理,您将了解如何在Keras深度学习库中开发用于多变量时间序列预测的LSTM模型。并基于LSTM模型进行血糖预测。

2021-04-16

pandas+invest.rar

A股2014-2020年机构重仓top100数据,机构包含、基金、外积、社保、保险、券商数据,以及对应的数据分析程序,进行综合排名分析、识别出穿越历史的大牛股、真龙到底是那些股?可以基于个人的理解进行代码修改进行权重、斜率等的设置获得不同的结果

2021-03-18

Multi-dimensional Data Visualization 从1维到6维.ipynb

数据可视化、从最少1维到最高6维,包含、箱图、直方图、密度图、折线图、平行图、散点图、立体图等;

2021-03-18

radiation_prediction_with_boosters and lstm.ipynb

使用集成学习模型xgboost、lightGBM、Catboost以及深度学习模型LSTM预测目标变量(因子),通过丰富的EDA、数据预处理、特征工程、特征选择、参数调优、模型对比分析、可视化分析(箱图、密度图、pair plot、)等步骤来进行整体的合理评估和分析。

2021-03-18

geoprocessing with python

geoprocessing with python for geo information processing

2018-03-03

numpy cookbook 2nd

numpy cookbook 2nd edition for effective array processing

2018-03-03

scala and spark for big data analytics

scala and spark for big data analytics for data processing

2018-03-03

practical predictive analysis

practical predictive analysis back to the future with R spark and more

2018-03-03

spark the definitive guide(epub)

spark the definitive guide care this is an epub version not PDF

2018-03-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除