分类
**码上人生**
在数据、代码中寻找诗和远方......
展开
-
2.4决策树之决策树实例
决策树junjun2016年2月8日#MarkDown脚本及数据集下载:http://pan.baidu.com/s/1dEx4vgX实例一、rpart包对iris数据进行分类#1、加载数据并查看data("iris")str(iris)## 'data.frame': 150 obs. of 5 variables:## $ S原创 2016-02-08 12:07:55 · 4730 阅读 · 1 评论 -
大数据项目1:客户回复预测与效益最大化
大数据项目1junjun2016年2月14日RMarkdown文档及数据集:http://pan.baidu.com/s/1dDRIONn参考书籍:R语言与数据挖掘最佳实践和经典案例_(澳)客户回复预测与效益最大化1、数据简介KDD Cup 1998年竞赛的目标是估计一个直邮的回复量,以便获得最多的捐款。数据集的格原创 2016-02-14 17:46:33 · 4200 阅读 · 0 评论 -
7.1、KNN实例
Loading [MathJax]/jax/output/HTML-CSS/jax.jsKNN实例junjun2016年2月10日实例一、K近邻算法R语言实践,使用class包中的三个函数knn()、knn1()、knn.cv()分别做K近邻分类,并比较结果#1、加载数据data("iris")#2、创建训练集和测试集数据library(原创 2016-02-10 17:10:09 · 3191 阅读 · 0 评论 -
9.1、神经网络实例
神经网络实例junjun2016年2月10日实例一、神经网络用于鸢尾花nnet包的nnet函数,nnet只能创建single-hidden-layer的神经网络#1、加载数据data("iris")#2、创建训练集和测试集数据index sample(1:2, nrow(iris), prob=c(0.7, 0.3), replace = T)t原创 2016-02-10 20:59:32 · 774 阅读 · 0 评论 -
9、神经网络
神经网络人工神经网络,可以把所有的Neutral networks表达为:1)激励函数:将输入信号转为输出信号。激励函数有Linear、Saturated Linear、Hyperbolic Tangent、Gaussian(又叫RBF:RadialBasis Function network)。2)网络拓扑:描述模型中神经元的数目以及有多少层,他们如何连接。网络拓扑涉及,层数、信息是原创 2016-02-10 20:37:22 · 1506 阅读 · 1 评论 -
8.1、支持向量机实例
支持向量机实例junjun2016年2月10日实例一、对鸢尾花使用SVM进行分类#1、加载数据data(iris)#2、创建测试集和训练集数据index sample(1:2, nrow(iris), prob=c(0.8, 0.2), replace=T)train_iris iris[index==1, ]test_iris iris[in原创 2016-02-10 19:18:32 · 2961 阅读 · 0 评论 -
8、支持向量机SVM
支持向量机1、支持向量机的应用领域:支持向量机可用于回归、分类和异常检验,前者即为支持向量机回归,后者为支持向量机分类。支持向量机应用在许多领域,包括手写数字识别、对象识别、演说人识别,以及基准时间序列预测检验;基因分组;文本分类(比如每篇文档的主题);检测一些很少发生但很重要的事件,比如内燃机引擎故障,地震,security breach。 SVM训练速度较慢;SVM能够对复杂的原创 2016-02-10 18:26:42 · 4560 阅读 · 1 评论 -
7、KNN(K近邻)
KNN(K最近邻算法)1、KNN行业应用:比如文字识别,面部识别;预测某人是否喜欢推荐电影(Netflix);基因模式识别,比如用于检测某中年疾病;客户流失预测、欺诈侦测(更适合于稀有事件的分类问题)KNN应用场景:通常最近邻分类器使用于特征与目标类之间的关系为比较复杂的数字类型,或者说二者关系难以理解,但是相似类间特征总是相似。KNN算法:简单有效,对数据分布没有假设,数据训原创 2016-02-10 16:01:31 · 5299 阅读 · 0 评论 -
6.3、朴素贝叶斯之垃圾邮件过滤
利用朴素贝叶斯来判断垃圾短信这里我们以判断垃圾短信为例,数据来自sms spam数据集1、数据准备----把数据下载后读入:>setwd("G:/R/Rworkspace/mail/")> sms_raw <- read.table("SMSSpamCollection.txt",stringsAsFactors=F, sep="\t", header=F, comment="",原创 2016-02-10 15:59:26 · 3922 阅读 · 2 评论 -
6.2、朴素贝叶斯实例
贝叶斯实例junjun2016年2月10日Rmarkdown脚本及数据集:http://pan.baidu.com/s/1hr0gTrI实例一、朴素贝叶斯对莺尾花进行分类#1、加载数据data("iris")#2、创建测试集和训练集数据library(caret)## Loading required package: lattice## L原创 2016-02-10 15:51:56 · 1300 阅读 · 0 评论 -
6.1、贝叶斯分类器
1、贝叶斯分类器:1)、实例一:考虑一个医疗诊断问题,有两种可能的假设:(1)病人有癌症。(2)病人无癌症。样本数据来自某化验测试,它也有两种可能的结果:阳性和阴性。假设我们已经有先验知识:在所有人口中只有0.008的人患病。此外,化验测试对有病的患者有98%的可能返回阳性结果,对无病患者有97%的可能返回阴性结果。 上面的数据可以用以下概率式子表示:P(cancer)=0.0原创 2016-02-10 15:27:31 · 1513 阅读 · 1 评论 -
6、贝叶斯
1、贝叶斯公式1)贝叶斯相关公式:先验概率:P(A)P(B) 先验概率可以由大量的重复实验所获得的各类样本出现的频率来近似获得,其基础是“大数定律”。后验概率:P(B|A) P(A|B)条件概率:P(A|B)=(P(AB)/P(B))=> P(AB)=P(B)*P(A|B)又P(AB)=P(BA) =>P(AB)=P(A)*P(B|A)=P(B)*P(A|B)贝叶斯公原创 2016-02-10 15:19:32 · 709 阅读 · 0 评论 -
4.3、adaboost/GBM/xgboost实例
adaboost实例junjun2016年2月8日adaboost实例实例一:利用adaboost算法对iris数据分类#1、加载数据data(iris)#2、创建训练集和测试集数据library(caret)## Loading required package: lattice## Loading required packa原创 2016-02-08 18:58:41 · 3300 阅读 · 0 评论 -
3.1、随机森林之随机森林实例
随机森林junjun2016年2月8日随机森林实例Markdown脚本及数据集:http://pan.baidu.com/s/1bnY6ar9实例一、用随机森林对鸢尾花数据进行分类#1、加载数据并查看data("iris")summary(iris)## Sepal.Length Sepal.Width Petal.原创 2016-02-08 15:37:27 · 23298 阅读 · 2 评论 -
大数据项目3:自动创建N棵决策树脚本
ctreeN <- function(n) { #1.读取数据 cup98 <- read.csv(“F:\R\Rworkspace\cup98lrn/cup98lrn.txt”) #2.设置训练集和测试集比例 LoopNum <- n trainPercentage <- 30 testPercentage <- 20 restPercentage <-原创 2016-02-16 12:04:59 · 828 阅读 · 1 评论