- 博客(3)
- 收藏
- 关注
![](https://csdnimg.cn/release/blogv2/dist/pc/img/listFixedTop.png)
原创 使用R语言 4秒对10万行qq群聊天记录进行基本的清洗整理
在R语言中通过sapply函数的向量化运算高速对数据进行数据清洗,是传统for循环速度的上千倍
2017-02-22 12:15:58
971
原创 基于R语言的分类算法之CART决策树
CART决策树“这棵树看起来生气了”——伐木机基于基尼指数增益最大化的原则,二叉树形式,如果特征变量拥有多个离散变量,则变成二叉树形式。例如学历有本科、硕士、博士,就转化成,本科-非本科(硕士或者博士),硕士-非硕士(本科或者博士),博士-非博士(本科或者硕士)代码library(rpart)library(rpart.plot)#iris分
2017-02-22 16:10:37
3858
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人