R语言数据挖掘资料

R语言数据挖掘资料

一、分类

1)决策树分类

http://blog.sina.com.cn/s/blog_6fb7db430100veen.html,包含理论知识与rpart包实例。​

http://blog.csdn.net/yujunbeta/article/details/14986219​,包含算法的自行实现,以及RWeka包的C4.5算法、tree包的CART算法。

2)神经网络

http://blog.csdn.net/yujunbeta/article/details/17201103,重点关注BP神经网络算法的自行实现(权值调整改进为动量因子)和nnet包的手写数字识别案例;手写数字案例的数据下载地址是 http://pan.baidu.com/s/1DuXFi。

​3)逻辑回归

http://eml.berkeley.edu/~train/software.html

离散选择模型大师Kenneth Train的个人主页,提供了matlab、R和GAUSS的源代码。个人推荐R代码中的RSGHB包,采用的估计方法是Hierarchical Bayes算法,相比传统的Maximum Simulated Likelihood方法而言能够有效地规避最大化可能带来singular问题。RSGHB包让用户自定义likelihood函数,因此非常灵活,可用于估计逻辑回归、Multinomial Logit、Nested Logit、Mixed Logit、Latent Class、Ordered Logit/Probit等模型。

主要函数doHB(likelihood, choicedata, control): likelihood为用户自定义函数,用于计算每个observation的概率,计算时使用的数据格式随意,可以是一个observation一行,也可以是一个alternative一行,用户只要保证能得到正确的likelihood即可;choicedata,需要提供两个信息,一个是observationID,可以是复合型的,即用户ID+choice situation,另一个是该observation对应的选择结果;control是MCMC过程的控制参数,包括模型名称、warm up iteration次数、收敛后sampling次数等。

关于离散选择模型的理论知识,强力推荐Kenneth Train的书籍Discrete Choice Methods with Simulation,在这个链接可以免费下载http://eml.berkeley.edu/books/choice2.html

http://blog.csdn.net/yujunbeta/article/details/17926443

对逻辑回归的原理进行了比较简单的介绍,包含R语言mlogit包和nnet包中multinorm的应用。

http://openclassroom.stanford.edu/MainFolder/CoursePage.php?course=DeepLearning
​​​​深度学习大师Andrew Ng的课程,讲述了线性回归、逻辑回归和正则项的基本知识,对梯度下降法、牛顿法的讲解深入浅出,并提供了matlab源代码。R代码的实现版本请参考本博客的相应文章。

http://blog.csdn.net/itplus/article/details/21896619​

系统地介绍了经典的极大似然估计方法,包括牛顿法、拟牛顿法(DFP、BFGS)、L-BFGS算法。

http://www.csdn.net/article/2014-02-13/2818400-2014-02-13;http://www.cnblogs.com/kobedeshow/p/3603148.html?utm_source=tuicool

应用Map-Reduce并行化逻辑回归

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值