- 博客(5)
- 收藏
- 关注
原创 客户流失预测--基于R语言C5.0
对于中国各大电信运营商而言,在整体市场规模相对稳定的情况下,能否维护好现有的客户是保证其收益的重中之重。因此,预测客户流失的可能性与否,直接关系到运营商的客户维护的重点正确与否。本文将基于”狗熊会“基础案例:收集客户流失,来演示基于C5.0算法的客户流失预测,数据下载点击打开链接。一、数据结构查看与初步分析读入并查看数据(见下图),一共包含10个变量,其中ID为每个用户的唯一标识,在进
2017-08-20 15:28:30 10888 3
翻译 C5.0决策树算法及性能提升
C5.0算法是基于C4.5开发的新版本,它能适用于很多类型的问题,同神经网络、支持向量机等复杂算法相比,它几乎可以表现地一样优秀,并且更容易理解和部署。这里我们将用UCI机器学习网站http://archive.ics.uci.edu/ml/index.php上信贷信息数据集介绍该算法,并讨论该算法下的模型性能提升。(数据可点击打开链接下载)该数据集包含了1000个信贷案例,一共有
2017-08-14 21:10:07 9577 5
原创 R语言数据清洗与规整-回归模型为例
数据清洗和规整是进行数据分析的前提条件,数据的清洗和规整通常会花费比进行数据分析更多的时间,正所谓“清洗一小时,分析五秒钟”。数据清洗和规整要依据实际数据的特征进行,其包括缺失值和冗余值的处理、数据重归类、字符类型转换等。这里将使用“狗熊会”的基础案例 “高考填报志愿,你选好了吗?”的数据进行介绍。该案例用于预测高校录取分数线的相关影响因素,因变量为x2015年平均线。数据下载链接:h
2017-07-10 20:29:45 7495 2
原创 R语言网页抓取入门-rvest包
R语言中的rvest包是极易掌握的网页抓取工具,只要进行适当的操作就可以入门网页抓取。1.背景介绍>install.packages("rvest") #安装rvest包>library(rvest) #加载rvest包,该过程中会自动加载xml2包rvest包中常用的函数有如下几个:read_html()用于下载网页;html_nodes()用于获取网页上的指定节点信息或者元
2017-07-02 21:15:27 17328 2
原创 R语言数据结构介绍-入门篇
R语言中用于存储数据的结构包括向量、矩阵、数组、数据框和列表,这五种结构之间联系紧密。在R语言中查看数据格式的函数为str()。1.向量 向量用 c() 创建,可以被用于存储数值型、字符型或逻辑型数据,但单个向量中只能存在一种数据类型,如a2.矩阵 不同于向量的一维结构(仅含一行),矩阵为二维结构,由行和列组成,相当于一个表格。但矩阵同样只能存储一种数据
2017-06-25 20:32:10 2811
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人