- 博客(3)
- 收藏
- 关注
原创 使用R语言 4秒对10万行qq群聊天记录进行基本的清洗整理
在R语言中通过sapply函数的向量化运算高速对数据进行数据清洗,是传统for循环速度的上千倍
2017-02-22 12:15:58 955
原创 基于R语言的分类算法之CART决策树
CART决策树 “这棵树看起来生气了”——伐木机 基于基尼指数增益最大化的原则,二叉树形式,如果特征变量拥有多个离散变量,则变成二叉树形式。 例如学历有本科、硕士、博士,就转化成,本科-非本科(硕士或者博士),硕士-非硕士(本科或者博士),博士-非博士(本科或者硕士) 代码 library(rpart) library(rpart.plot) #iris分
2017-02-22 16:10:37 3837
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人