自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 r 直接从网上获取数据

从网上获取数据如果需要从网上下载多个文件,用函数download.file(),调用格式为:download.file(url, destfile, method, quiet = FALSE, mode = "w",cacheOK = TRUE, extra = getOption("download.file.extra"))主要的参数为:url:文件的所在地址destfi

2017-01-15 16:30:13 7428

原创 R--SVM支持向量机

数据来源:以扫描字符的识别为例,[Letter Recognition Dataset](https://archive.ics.uci.edu/ml/datasets/Letter+Recognition)install.packages("knitr")install.packages("kernlab")library(kernlab)library(knit)

2017-01-06 10:25:44 772

原创 R —— Random Forest

1. 基本思想        用随机的方式建立一个森林,森林里面有很多的决策树组成,随机森林的每一棵决策树之间是没有关联的。在得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每一棵决策树分别进行一下判断,看看这个样本应该属于哪一类(对于分类算法),然后看看哪一类被选择最多,就预测这个样本为那一类。2. 随机森林与决策树关系        决策树相当于一个大师,通过自己在数

2017-01-05 17:21:35 8516 2

原创 R 决策树

sample()机器学习中,随机划分训练集和测试集>set.seed(2016) ##为了获得可重现的结果,随机种子设定为固定值> ind<-sample(2,nrow(iris),replace=TRUE,prob=c(0.7,0.3)) ### 70%数据用于测试,30%数据用于训练> ind [1] 1 1 1 1 2 1 1

2017-01-05 10:30:31 4282

原创 R studio 导入数据与处理

设置常用工作目录: 导入数据,先查看工作目录,再把数据文件放到工作目录内> getwd() > setwd("/Users/yuki/desktop/machine learning"> credit=read.table("german.data.txt",header=F,sep=" ",stringsAsFactors=F)###如何知道h

2017-01-04 10:54:35 29464

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除