- 博客(4)
- 收藏
- 关注
原创 R语言捕获错误
tryCatch语法R语言中捕获错误的方法。基本语法:result = tryCatch({ # 主体表达式,存在于花括号中 expr}, # 捕获warning,执行warning韩式,参数为warning信息warning = function(warning_condition) { warning-handler-code}, # 捕获error,执行error函数,参数为error信息error = function(error_condition) {
2020-09-23 09:18:18 1323
原创 Pandas 实现循环的三大利器
1. 概述在实际工作中,基于 pandas进行数据处理的时候,经常会对数据框中的单行、多行(列也适用)甚至是整个数据进行某种相同方式的处理,比如将数据中的 sex字段将男替换成1,女替换成0。其中,for循环是一种简单、直接的方式,但运行效率很低。本文介绍了 pandas中的三大利器: map、apply、applymap。2. 数据模拟import pandas as pdimport numpy as npboolean = [True, False]gender = ["Male",
2020-09-13 15:33:15 2418
原创 R语言安装包的几种方法
1. 直接安装# R包-直接安装install.packages("ape")# Bioconductor包-暗转if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager")BiocManager::install("pkp")2. 基于下载地址packageurl <- "http://cran.r-project.org/src/contrib/Archive/gg
2020-09-08 14:33:32 9766 2
原创 多重共线性问题
概述在将数据放入到模型中进行训练时,经常需要检验各维度之间的可能存在的多重共线性的问题。接下来将简单介绍共线性的识别和常用解决办法。概念多重共线性:是指模型中的自变量之间存在较强的线性关系,多重共线性的存在不仅会导致模型的过拟合,而且还会导致回归模型的稳定性和准确性大大的降低。出现场景容易出现多重共线性的场景:数据样本量的不足会导致多重共线性。多个变量之间都基于有同趋势的数据。多个变量之间存在着近似线性的关系。多重共线性的识别一般含有如下指标:容忍度、方差膨胀因子、特征值等几个特征来
2020-09-02 13:13:13 5262
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人