★★R软件基础
r基础
维格堂406小队
人天生都是软弱的,唯其软弱而犹能承担起苦难,才显出人的尊严。
展开
-
RNote113---smbinning分箱并输出到Excel
用IV做单变量分析,需要关注每个bin的覆盖率和逾期率。把smbinning的结果和图输出到指定的Excel中。 统计分析# ------------------------------***统计分析函数***------------------------------## parameter : x-feature,y-label,data-dataframe,## 参...原创 2018-07-13 10:30:30 · 1410 阅读 · 0 评论 -
RNote112---安装rJava包
用xlsx包时候需要安装rJava,但是要先配置java环境。简单记录下: 1 下载jdk 官网地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html,点击自己电脑对应系统的文件,下载即可。 2 安装jdk 安装jdk有两次选择路径,把jre...原创 2018-07-10 12:58:11 · 3080 阅读 · 0 评论 -
RNote111---[转载]R语言内存管理
转自:R语言内存管理 参考资料2 R中的对象(比如矩阵)在内存中存于两种不同的地方:第一种是堆内存(heap),其基本单元是“Vcells”,每个大小为8字节,新来一个对象就会申请一块空间,把值全部存在这里,和C里面的堆内存很像;第二种是地址对(cons cells),主要用来存储地址信息,最小单元一般在32位系统中是28字节、64位系统中是56字节。ls()来查看当前所有对象名,对于每一个转载 2017-05-13 17:40:45 · 1107 阅读 · 0 评论 -
RNote110---linux下安装RStudio Server
在xshell里操作实在有点麻烦,为了提高工作效率,安装下RStudio Server~linux系统环境查看linux配置 版本:Red Hat 4.8.3-9 64位 安装RStudio Server1、 下面网址里找到对应的RStudio Server版本 https://www.rstudio.com/products/rstudio/download-server/ 2、 lin原创 2017-08-12 13:05:56 · 9324 阅读 · 0 评论 -
RNote109---linux环境下安装R包
报错处理连接mirror失败#查看配置信息 ?download.file#可能是linux没有安装wgetyum install wget相关包安装1、安装mongolite包#linux版本为CentOS,需要安装cyrus-sasl-develyum install openssl-develyum install cyrus-sasl-devel原创 2017-07-27 13:56:17 · 2835 阅读 · 0 评论 -
RNote108---显示R程序的运行进度
本来是想找显示shiny中程序运行进度的方法,不过只看到显示循环执行进度的~Whatever,记录下吧一、tcltk包案例:library(tcltk) u <- 1:2000 #开启进度条 pb <- tkProgressBar(title="进度",label="已完成 %", min=0, max=100, initial = 0, width = 300) for(i i原创 2017-09-18 15:18:46 · 11948 阅读 · 0 评论 -
RNote107---Linux定时运行R脚本
目的是把R处理后的数据塞到数据库里面,需要在服务器上设置定时任务~安装网上有这种安装方式,但是我没有安装成功。 找不到此安装包~ 另外运维在搞服务器的时候好像就已经搞好这个了~yum -y install vixie-cronyum -y install crontabs文件格式文件格式类似于yarn和trainer配置任务的方式,在tc还是学到蛮多东西的嘛~ 分别是分、时、天、月、周几参数原创 2017-08-26 17:27:35 · 720 阅读 · 0 评论 -
RNote106---Windows定时运行R脚本
配置环境变量先配置环境变量 右击计算机—属性—更改设置—高级—环境变量 R Code然后写R的脚本 有个坑:路径要写完整,不能用.简写write.table(x=1:10,"D:/Documents/My R/Learning_R/timed_task/test.txt",row.names = F)BAT脚本接着bat脚本,txt另存为即可。原理不知,依葫芦画瓢Rscript -e "sou原创 2017-05-08 17:40:31 · 1361 阅读 · 0 评论 -
RNote105---match.arg用法
center <- function(x, type = c("mean", "median", "trimmed")) { type <- match.arg(type) print(type) switch(type, mean = mean(x), median = median(x), trimmed = mean(x, trim = 0.1))}...原创 2019-12-20 17:36:11 · 5536 阅读 · 0 评论 -
RNote104---编译字符串&执行代码
knitr::opts_chunk$set(echo = TRUE)目的 目的:执行以字符串形式保存的代码。有的时候不知道变量的个数或者名称,所以不能在程序里面写死,需要根据实际情况,生成相应的字符串。用以解析,并且执行。 案例 案例很简单,有一个向量x,希望把他对应位置的值,赋给相应变量,变量名为x1,x2等。 根据之前文章介绍https://blog.csdn....原创 2018-07-12 17:08:31 · 640 阅读 · 0 评论 -
RNote103---R中的变量名操作
knitr::opts_chunk$set(echo = TRUE) 目的明确:循环赋值时,希望取出的字符串直接作为变量名。 exists 查看当前工作空间是否存在该对象。 # 1.注意输入的是字符串# 2,返回 FALSEexists("test")# 返回TRUEtest <- 1:10test_name <- "test"exis...原创 2018-07-12 10:52:52 · 3340 阅读 · 0 评论 -
RNote102---时间处理
覆盖常用的时间处理操作,如:字符串转日期日期转字符串生成指定时间间隔的序列数据生成间隔时序vectortimeRange <- function(starttime, endtime, step="15 mins", inputFormat='%Y%m%d%H%M%S', outputFormat='%Y%m%d%H%M%S'){ # 转换成POSIXlt格式 start_slice_p <- strptime(starttime, inputFormat) end原创 2020-05-18 08:58:35 · 221 阅读 · 0 评论 -
RNote101---多线程处理
R的循环效率比较慢,通常可以使用apply族函数进行加速,那么多线程怎么整?只介绍方法,原理不是很懂。R会给出程序运行时间,供参考:用户:是消耗在应用程序(非操作系统部分)执行的时间系统:是底层操作系统执行(例如磁盘读写等)部分的时间流逝:是经过的总时间(可以认为是前两者的总和)snow包先查看电脑有几个core我现有电脑配置是6核,逻辑处理器是12parallel::de...原创 2020-04-23 08:53:10 · 401 阅读 · 0 评论 -
RNote100---Tricks of R
1、do.call函数针对list里的所有元素执行某一函数,如对N个数据框执行行合并的操作 do.call(“sum”,list(2,4)) [1] 6 2、library()如何引用变量如果包的名字以变量传到library中,需要设置character.only = Tpackage &amp;amp;amp;amp;amp;amp;amp;amp;amp;lt;- ggplot2library(package, character....原创 2017-06-09 17:57:12 · 805 阅读 · 0 评论 -
RPackage011---SMOTE
knitr::opts_chunk$set(echo = TRUE)AIM主要目标学习SMOTE算法,并且利用DMwR实现该算法,用以处理类不平衡问题。 简介该函数使用SMOTE算法处理类不平衡问题。简而言之,这个函数能够生成SMOTE算法处理之后的数据。或者,它也可以在新生成的数据集建立二分类模型,并且返回最终的模型。 函数使用方式CodeSMOTE(form, data, perc.over原创 2017-11-21 17:06:28 · 2425 阅读 · 0 评论 -
RPackage010---dummy
Intr对数据框中的因子型和字符串变量快速高效地创建哑变量。在网上搜哑变量和one-hot encoding,碰巧看到的。感觉还是python比较适合,依赖一个库就好,R真是各个包,不继续维护的话,没准有很多坑。Functioncategories主要作用:抽取分类变量的值,是生成哑变量的预处理工作。 categories函数抽取数据框中所有的因子型和字符型变量,忽略数值型变量,是dummy函数的原创 2017-09-23 23:27:42 · 870 阅读 · 0 评论 -
RPackage009---dplyr
1、取子集类似于基础函数的subset~## 基础函数,感觉subset反而更方便## 参数:指定数据框、筛选行、筛选列subset(x=iris,Sepal.Length<5,select=Sepal.Length)## dplyr## filter筛选行、select筛选列library(dplyr)iris %>% filter(Sepal.Length<5) %>% select原创 2017-11-08 11:48:26 · 282 阅读 · 0 评论 -
RPackage008---Rjson&RJSONIO
整理下之前的笔记,发现当年在杭州还写过r解析json的东西,直接复制代码了,懒得搞~rjson# Ref: http://www.dataguru.cn/article-3537-1.html# install.packages("rjson")library(rjson)getwd()# fromJSON() 从JSON到R ------------------------------------------------------json_data <- fromJSON(fil原创 2020-05-18 00:12:49 · 508 阅读 · 1 评论 -
RPackage007---smbinning
knitr::opts_chunk$set(echo = TRUE) 这个包主要是进行woe分组时候用的,有比较丰富的函数可以用。简单介绍其中两个函数,最优分箱和自定义分箱。业务希望可以自动寻参,虽然实际用的时候,自动分箱经常无解,但是也可以通过手动设置阈值来作为参考。 Intro 对R的版本有要求,3.4.0以上。升级R的话用installr倒是可以,但是默认是升级到最新版...原创 2018-04-05 19:30:18 · 2810 阅读 · 0 评论 -
RPackage006---xlsx
knitr::opts_chunk$set(eval = FALSE, include = FALSE)1.需求 工作中需要把单变量分析的结果保存在Excel中,结果分为:数据和图片。利用xlsx这个包,可以完成大部分工作。 2.环境配置 依赖的包为'tidyverse', 'rJava', 'xlsxjars', 'xlsx',其中rJava需要配置java环境。具...原创 2018-07-10 15:36:33 · 285 阅读 · 0 评论 -
RPackage005---Rwordseg
直接上代码,有问题看文档,大部分能解决吧~# 安装说明 --------------------------------------------------------------------## https://r-forge.r-project.org/R/?group_id=1054 官网下载手动安装## rJava不赘,网上有教程library(rJava) library(Rwo原创 2017-10-13 15:47:39 · 466 阅读 · 0 评论 -
RPackage004---mailR自动发邮件
Intro网上无意中看到别人的博客,感觉挺有意思的。玩一玩~ 目前测试只发现163邮箱可以成功,而且要先开通smtp权限貌似Code# MyEmail.RtryCatch({ library(mailR)}, error = function(e) { print("NO mailR Packages") print(conditionMessage(e))#打印错误信息 in原创 2017-05-08 16:26:50 · 3893 阅读 · 5 评论 -
RPackage003---tryCatch和log4r生成报错日志
Intro工作中实际接触到的,记录下~实际编程中似乎常用,我这个调包党还是有点low呀Code# 利用tryCatch和log4r包记录报错信息 -------------------------------------------------#把报错信息储存在全局变量problem中tryCatch({ for (i in 1:10) { j = j + 1 print(1原创 2017-05-08 11:46:23 · 1392 阅读 · 0 评论 -
RPackage002---stringr
看了下stringr包的文档,常用的应该是匹配正则那一块吧。后面如果实际工作遇到需要处理的情况,就加上些case吧.# ****************stringr学习**************** -------------------------------------------------------# *****字符串的转换***** -------------------------原创 2017-09-22 11:08:55 · 458 阅读 · 0 评论 -
RPackage001---animation
最近看PLA时,想要观察分隔超平面的更新情况,所以尝试用R画更新的过程,即动图。 环境配置 ImageMagic安装,官网http://www.imagemagick.org/script/download.php。我选择的是ImageMagick-7.0.7-15-Q16-x64-static.exe。指定目录,默认选项安装即可。R实现library(animation)## 指定Image原创 2017-12-18 16:01:51 · 564 阅读 · 0 评论