自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 客户流失预测--基于R语言C5.0

对于中国各大电信运营商而言,在整体市场规模相对稳定的情况下,能否维护好现有的客户是保证其收益的重中之重。因此,预测客户流失的可能性与否,直接关系到运营商的客户维护的重点正确与否。本文将基于”狗熊会“基础案例:收集客户流失,来演示基于C5.0算法的客户流失预测,数据下载点击打开链接。一、数据结构查看与初步分析读入并查看数据(见下图),一共包含10个变量,其中ID为每个用户的唯一标识,在进

2017-08-20 15:28:30 10888 3

翻译 C5.0决策树算法及性能提升

C5.0算法是基于C4.5开发的新版本,它能适用于很多类型的问题,同神经网络、支持向量机等复杂算法相比,它几乎可以表现地一样优秀,并且更容易理解和部署。这里我们将用UCI机器学习网站http://archive.ics.uci.edu/ml/index.php上信贷信息数据集介绍该算法,并讨论该算法下的模型性能提升。(数据可点击打开链接下载)该数据集包含了1000个信贷案例,一共有

2017-08-14 21:10:07 9577 5

原创 R语言数据清洗与规整-回归模型为例

数据清洗和规整是进行数据分析的前提条件,数据的清洗和规整通常会花费比进行数据分析更多的时间,正所谓“清洗一小时,分析五秒钟”。数据清洗和规整要依据实际数据的特征进行,其包括缺失值和冗余值的处理、数据重归类、字符类型转换等。这里将使用“狗熊会”的基础案例 “高考填报志愿,你选好了吗?”的数据进行介绍。该案例用于预测高校录取分数线的相关影响因素,因变量为x2015年平均线。数据下载链接:h

2017-07-10 20:29:45 7495 2

原创 R语言网页抓取入门-rvest包

R语言中的rvest包是极易掌握的网页抓取工具,只要进行适当的操作就可以入门网页抓取。1.背景介绍>install.packages("rvest") #安装rvest包>library(rvest) #加载rvest包,该过程中会自动加载xml2包rvest包中常用的函数有如下几个:read_html()用于下载网页;html_nodes()用于获取网页上的指定节点信息或者元

2017-07-02 21:15:27 17328 2

原创 R语言数据结构介绍-入门篇

R语言中用于存储数据的结构包括向量、矩阵、数组、数据框和列表,这五种结构之间联系紧密。在R语言中查看数据格式的函数为str()。1.向量    向量用 c() 创建,可以被用于存储数值型、字符型或逻辑型数据,但单个向量中只能存在一种数据类型,如a2.矩阵    不同于向量的一维结构(仅含一行),矩阵为二维结构,由行和列组成,相当于一个表格。但矩阵同样只能存储一种数据

2017-06-25 20:32:10 2811

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除