R学习经
王畅
热爱大数据,ml,dm,cs
展开
-
利用R写遗传算法
利用R写遗传算法遗传算法的参数通常包括以下几个:种群规模(Population),即种群中染色体个体的数目。 染色体的基因个数(Size),即变量的数目。 交配概率(Crossover),用于控制交叉计算的使用频率。交叉操作可以加快收敛,使解达到最有希望的最优解区域,因此一般取较大的交叉概率,但交叉概率太高也可能导致过早收敛。 变异概率(Mutation),用于控制变异计算的使用频率,决定了遗转载 2015-03-19 20:45:57 · 9110 阅读 · 1 评论 -
聊聊R的优势
R与其他统计软件比较SAS: 速度快,有大量统计分析模块,可扩展性稍差,昂贵。SPSS: 复杂的用户图形界面,简单易学,但编程十分困难。Splus: 运行S语言,具有复杂的界面,与R完全兼容,昂贵。有人说R的最大缺点是对文本处理存在短板,的确相对于Python来说R的优势在于绘图和统计计算。原创 2016-03-12 19:26:37 · 786 阅读 · 0 评论 -
R语言——数据分析与数据挖掘在常规工作中的应用
大纲:1 数据质量分析1.1 缺失值分析1.2 异常值分析1.3 一致性分析2 数据特征分析2.1 分布分析 2.2 对比分析2.3 统计量分析2.4 周期性分析2.5 贡献度分析2.6 相关性分析3 R语言主要数据探索函数 3.1 统计特征函数3.2 统计作图函数3.3 小结数据预处理4.1 数据清洗4.1.1 缺失值处理原创 2017-01-02 21:15:50 · 968 阅读 · 0 评论 -
数据分析与数据挖掘在常规工作中的应用——数据异常值
原创 2017-01-03 22:17:49 · 463 阅读 · 0 评论 -
数据分析与数据挖掘在常规工作中的应用——基本统计量描述
常见统计量:均值,中位数,众数,变异系数,极差,方差,四分位数等原创 2017-01-04 22:12:14 · 589 阅读 · 0 评论 -
数据分析与数据挖掘在常规工作中的应用——基本统计量案例
原创 2017-01-04 23:40:31 · 455 阅读 · 0 评论 -
数据分析与数据挖掘在常规工作中的应用——数据清洗之缺失值处理
数据清洗的数据缺失值填补方式原创 2017-01-07 22:02:08 · 967 阅读 · 0 评论 -
数据分析与数据挖掘在常规工作中的应用——数据规范化
原创 2017-01-08 18:12:55 · 749 阅读 · 0 评论 -
数据分析与数据挖掘在常规工作中的应用——数据 离散化
常见离散化方法:1等宽离散化2等频离散化3聚类离散化原创 2017-01-08 20:56:57 · 655 阅读 · 0 评论 -
被遗忘的R中的sql语句
本文主要介SQL在R语言中的应用,很多人将SQL遗忘,在利用R的时候,特别是当工具繁多的时候,R中也有不用连接数据库来练习SQL语句。1.安装sqldf()包install.packages("sqldf")sqldf(sqldf)sqldf()所属R语言包:sqldf SQL select on原创 2016-03-22 08:20:20 · 550 阅读 · 0 评论 -
R语言中的svm实例
svmWANGChang2016年2月18日n=150p=2sigma = 1meanpos = 0meanneg =3npos = round(n/2)nneg = n-npos##生成数据中正负实例样本特征值xpos = matrix(rnorm(npos*p,mean =meanpos,sd = sigma),npos,p)xneg = m原创 2016-02-18 12:42:44 · 18007 阅读 · 2 评论 -
关于学习朴素贝叶斯心得
朴素贝叶斯假设:基于属性相互独立。原理:基于贝叶斯定理,p(c|x)=p(x|c)*p(c)/p(x),根据贝叶斯定理,后验概率P(Y=c | X=x) = 条件概率P(X=x | Y=c) * 先验概率P(Y = c) / P(X=x),取P(X=x | Y=c) * P(Y = c)最大的分类作为输出。c表示类别(c1,c2),x表示属性(x1,x2,x3,....)P(A原创 2015-10-31 00:16:17 · 1219 阅读 · 0 评论 -
r
mcga包我们使用mcga包的mcga()函数,可以实现多变量的遗传算法。mcga包是一个遗传算法快速的工具包,主要解决实值优化的问题。它使用的变量值表示基因序列,而不是字节码,因此不需要编解码的处理。mcga实现了遗传算法的交配和突变的操作,并且可以进行大范围和高精度的搜索空间的计算,算法的主要缺点是使用了256位的一元字母表。 例1:设fx=(x1-5)^2 + (x2-55)^2 +(x3-转载 2015-03-20 20:16:51 · 631 阅读 · 0 评论 -
书写R的相关算法
笔者决定从心开始梳理一下自己曾经学习过的算法。当做自己的一部经书。原创 2015-03-12 20:18:45 · 414 阅读 · 0 评论 -
R做基本的用户行为分析
R做基本的用户行为分析1. 数据源保密2.了解数据基本描述为筛选数据做铺垫action<-read.csv("C:\\Users\\Administrator\\Desktop\\20150804\\TU.csv")rc<-c(nrow(action),ncol(action))#查看数据集的行列rc#这是数据集的行和列summary(action) #查看数据表的描述属性从数据描述可以看到:原创 2015-08-12 10:51:45 · 1287 阅读 · 1 评论 -
关于基本的R的描述
1.数据来源略。2.数据描述data1<-read.csv("C:\\Users\\Administrator\\Desktop\\user_action_data.csv")k=nrow(data1[!complete.cases(data1),])#缺失的行数ksummary(data1)#描述数据id<-table(data1$ID)#查看频率iduser_id<-table(da原创 2015-08-12 11:19:25 · 460 阅读 · 0 评论 -
R的一些基本操作
uaa<-read.csv("C:\\Users\\Administrator\\Desktop\\TU.csv",head = TRUE)uaa1<-uaa[-c(5)]#删除第5列summary(uaa1)#描述数据集write.table( uaa, file = "C:\\Users\\Administrator\\Desktop\\TU1.csv",sep = ",", col.na原创 2015-08-12 11:03:26 · 376 阅读 · 0 评论 -
对于一些R数据分析的体会
action<-read.csv("C:\\Users\\Administrator\\Desktop\\20150806\\user_action_data3.csv", header=T )#导入数据action1<-action[action$CET_TYPE==1,]#选择某一行 sort(table(action1$USER_ID),decreasing =T)#排序head(s原创 2015-08-13 15:36:22 · 438 阅读 · 0 评论 -
关于R画误差分析图——做到和MATLAB一样
a=read.table("C:\\Users\\Administrator\\Desktop\\data.txt",head= T)k<-c(10,20,30,40,50,60,70,80,90,100)matplot(k,a,type ="o",pch=15:18,lty =1,bg = "yellow",lwd=1,xlab = "K-邻居数目" ,ylab = "MAE",font =原创 2015-08-14 16:51:23 · 4013 阅读 · 0 评论 -
网站指标操作
网站指标操作环境:R,win7插件:gWidgetRGtk2、gWidget2包,Gtk插件 install.packages("gWidgets")library(gWidgets2)library(RColorBrewer)#颜色包mouthweekwindow=gwindow("xxx网站数据指标分析系统")BigGroup = ggroup(cont原创 2015-10-25 10:46:56 · 384 阅读 · 0 评论 -
数据分析与数据挖掘在常规工作中的应用——日期处理
日期数据处理包lubridate原创 2017-01-15 23:34:21 · 726 阅读 · 0 评论