自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 关联规则挖掘学习笔记

1.关联规则介绍一个典型的关联规则可以表述为如下形式:(花生酱,果冻)→(面包)这个关联规则表示,如果购买了花生酱和果冻,那么他很可能会购买面包。这就是关联规则的基本思想。这里我们通过一个虚拟案例来理解关联规则的思想。假设一个虚拟医院礼品店经营的商店集D={鲜花,苏打水,慰问卡,气球,毛绒玩具,块状糖},有探望病人的朋友或家人会来此购买一些东西,其中形成5条交易记录如下表所示:交...

2019-05-07 16:54:11 701

原创 Kaggle:Give me some credit(2)

3.特征工程2.1 数据分箱利用caret包中的createDataPartition(数据分割功能)函数将数据随机分成相同的两份。训练集和测集的结果是平衡的,大致都为6.6%左右,因此可以采用这份切割的数据进行建模及预测。set.seed(123) splitIndex<-createDataPartition(traindata$y,time=1,p=0.5,list=FALS...

2019-05-05 17:21:34 1069

原创 Kaggle:Give me some credit(1)

背景信用评分算法,对默认可能性进行猜测,这是银行用来判断贷款是否应该被授予的方法,完成一个评分卡,通过预测某人在未来两年将会经历财务危机的可能性来提高信用评分的效果,帮助贷款人做出最好的决策本项目主要为申请者评分模型的开发过程。数据集介绍数据来源:数据来自Kaggle,cs-training.csv是有15万条的样本数据,下图可以看到这份数据的大致情况。下载地址为:https://www....

2019-04-24 13:39:47 2113 1

原创 感知机算法学习笔记(带例题及代码)

感知机算法学习感知机感知机是二分类的线性分类模型,其输入为实例的特征向量,输出实例为类别,取+1和-1二值,属于判别模型。感知机学习旨在求出能够将训练数据集进行正确的分类的分离超平面的。为此,导入基于误分类的损失函数,利用梯度下降法对损失函数进行极小化,求得感知机模型。感知机具有简单易实现的优点,分为原始和对偶形式。感知机模型定义:称函数y=f(x)=sign(全新的界面设计 ,将会带...

2019-04-21 10:37:00 14992 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除