自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

转载 机器学习经典算法详解及Python实现--决策树(Decision Tree)

 (一)认识决策树 1,决策树分类原理 决策树是通过一系列规则对数据进行分类的过程。它提供一种在什么条件下会得到什么值的类似规则的方法。决策树分为分类树和回归树两种,分类树对离散变量做决策树,回归树对连续变量做决策树。 近来的调查表明决策树也是最经常使用的数据挖掘算法,它的概念非常...

2016-12-21 13:46:10

阅读数 1027

评论数 0

转载 机器学习-CrossValidation交叉验证Python实现

 1.原理 1.1 概念 交叉验证(Cross-validation)主要用于模型训练或建模应用中,如分类预测、PCR、PLS回归建模等。在给定的样本空间中,拿出大部分样本作为训练集来训练模型,剩余的小部分样本使用刚建立的模型进行预测,并求这小部分样本的预测误差或者预测精度,同时记录它们...

2016-12-19 11:58:53

阅读数 4376

评论数 0

转载 在分类中如何处理训练集中不平衡问题

 原文地址:一只鸟的天空,http://blog.csdn.net/heyongluoyao8/article/details/49408131 在分类中如何处理训练集中不平衡问题   在很多机器学习任务中,训练集中可能会存在某个或某些类别下的样本数远大于另一些类别下的样本数目。即类别不...

2016-12-19 10:09:11

阅读数 335

评论数 0

原创 R语言采用多元回归建模的基本步骤

前言:本次建模过程是基于RedHat6.8或者CentOS6.8,R3.1.2,Rstudio-server 关于R3.1.2,Rstudio-server的整个配置,原始数据(已经脱敏处理,不涉及泄密,如有侵权,请随时联系)以及本分析的源码均放置在GitHub上,通过click here访问数...

2016-12-18 21:02:52

阅读数 5989

评论数 1

转载 多人在线协作R开发RStudio Server

R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大。 R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是...

2016-12-18 16:28:01

阅读数 602

评论数 0

转载 使用R语言绘制其他图形之相关系数图

之前ggplot2系列中我们已经学会了常用的统计图形,如条形图、直方图、散点图、折线图、饼图和地图等,今天再和大家谈谈R语言中常用的其他图形,如相关系数图。 虽然cor()函数可以非常方便快捷的计算出连续变量之间的相关系数,但当变量非常多时,返回的相关系数一定时读者看的眼花缭乱。 下面...

2016-12-18 16:26:22

阅读数 13221

评论数 1

转载 R语言读取Excel文件

因为一个项目需要,原始数据全部是Excel文件,包括.xls和.xlsx格式,并且很多excel数据的格式并不规范,一个个转为csv格式不太现实,所以把所有能了解到的读取excel的方法都试了一遍,做个简单汇总。 相关的包:RODBC、xlsx、openxlsx、gdata、readxl,测试平...

2016-12-17 23:42:15

阅读数 455

评论数 0

翻译 run “sudo R CMD javareconf” get “Cannot find any Java interpreter”

I tried to install a plugin for eclipse,but get an error,after some googling,got a suggestion to run:sudo R CMD javareconf,but got this error: *** C...

2016-12-17 23:36:41

阅读数 791

评论数 0

原创 Linux 下R及rstudio-server安装_及配置管理

系统版本是Centos6.8 大家都懂的,你要有某个文件夹的权限下,就可以开始安装R和Rstudio,然后就可以通过网页访问了,安装顺序是: 1.安装相关组件 yum install gcc-gfortran yum install gcc gcc-c++ yum install ...

2016-12-17 19:35:20

阅读数 2365

评论数 0

转载 如何在linux环境下使用r语言

如何在linux环境下使用r语言 真朱丶379| 浏览 1974 次 发布于2015-12-23 13:05最佳答案 1、下载 wget http://mirror.bjtu.edu.cn/cran/src/base/R-3/R-3.0.1.tar.gz 2、解压: tar...

2016-12-17 17:04:35

阅读数 4255

评论数 0

转载 CentOS6.4使用YUM安装Adobe Flash Player

方法一: 安装 Flash Player 以管理员身份登录。 yum install flash-plugin 验証安装 安装好后,重新启动FireFox,在地址栏输入【about:plugins】确定 Shockware Flash 是否安装成功并启用。 更新 Fla...

2016-12-17 16:48:19

阅读数 246

评论数 0

转载 在CentOS 7/6.5/6.4 中安装Java JDK 8

本教程介绍如何安装和在CentOS7,6.5,和6.4的服务器上配置最新的Oracle的JavaJDK。虽然,这些步骤应该同样适用于其他基于RPM的发行版,如RHEL7,6.x,Scientific Linux6.x和Fedora。 首先,在你的服务器上运行一下更新。 yum upda...

2016-12-17 16:40:33

阅读数 263

评论数 0

转载 Building R-devel on RedHat Linux 6

Warning: I’m 85% done with this, formatting is not right. I DO NOT want to type in the prompt in front of every command because then one cannot copy/...

2016-12-17 16:03:15

阅读数 1104

评论数 0

转载 R语言 linux安装

由于希望在Hadoop集群上配置RHadoop,自然需要在每个服务器节点上安装R语言。在安装过程也碰到了一些小问题,因此记录一下。     首先服务器系统版本为centos5.6,R版本为2.13.2。下面是安装步骤:    1、解压文件:tar –zvxfR-2.13.2.tar.gz ...

2016-12-17 16:02:13

阅读数 510

评论数 0

转载 总结下R语言进行简单多元回归的基本步骤

 最近论文,刚好研究下R的回归分析。作此笔记,以便将来参考。 1.读入数据,R-STUDIO直接有按钮,否则就 > zsj 数据一般从excel的CSV或者txt里读取,实现整理好以符合R的数据框的结构 ps1:这块有很多包提供从不同来源读取数据的方法,笔...

2016-12-15 17:04:59

阅读数 9815

评论数 0

转载 R语言多元线性回归

 1、根据业务经验挑选出可能对预测目标变量有影响的指标; 2、将这些指标对目标变量做相关性分析cor(),挑选出相关系数较大的指标进一步分析; 3、检验这些指标与目标变量是否线性关系,一般可以plot()检验,如果非线性,尝试做平方或开方等方法使之变成线性; 3、将相关系数较大的指标全...

2016-12-15 17:03:17

阅读数 539

评论数 0

转载 ValueError: The indices for endog and exog are not aligned

  I am getting above error when I am running an iteration using FOR loop to build multiple models. First two models having similar data sets bu...

2016-12-15 16:36:34

阅读数 2143

评论数 0

转载 Python numpy生成矩阵、串联矩阵

 版权声明:本文为博主原创文章,未经博主允许不得转载。 import numpy 生成numpy矩阵的几个相关函数: numpy.array() numpy.zeros() numpy.ones() numpy.eye() 串联生成numpy矩阵的几个相关函数:...

2016-12-13 13:58:12

阅读数 1156

评论数 0

转载 分分钟学会用python爬取心目中的女神——Scrapy

作者:战神王恒 本博文将带领你从入门到精通爬虫框架Scrapy,最终具备爬取任何网页的数据的能力。本文以校花网为例进行爬取,让你体验爬取校花的成就感。 Scrapy,Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化...

2016-12-11 18:57:14

阅读数 450

评论数 0

转载 Python笔记-几种取整方式

 背景 在处理数据的时候,碰到了一个问题,就是取整方式!比如给定一个数值型列表,我需要分别获取它位置为长度的0%,25%,50%,75%,100%处的几个数字。但Python自带的 int 是向下取整,如果数字长度是5,理论上这五个数字分别对应0%,25%,50%,75%,100%的位置...

2016-12-09 16:19:48

阅读数 221

评论数 0

提示
确定要删除当前文章?
取消 删除