自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (4)
  • 收藏
  • 关注

原创 kaggle心得

kaggle比赛心得一、研究目的二、数据探索三、数据清洗四、数据描述五、特征工程六、拟合模型一、研究目的80/20原则被许多企业证明是正确的——只有一小部分客户产生了大部分收入。因此,营销团队面临的挑战是在促销策略上进行适当的投资。在这个比赛中,选手需要分析一个Google商品商店(也称为GStore,Google swag在这里销售)的客户数据集,以预测每个客户带来的营收。希望其结果是更加...

2020-07-01 09:06:26 665 2

原创 高精准的分类方法---Boosting

基本思想 回忆袋装技术: 根据重抽样自举法(各观测被抽到的概率相等1/n)建立k棵树,最后这k棵树各自对数据进行预测,预测结果根据少数服从多数规则得出最终结果。对袋装技术的改进–boosting: boosting也是进行重抽样,但是希望每次抽样,能较大概率的抽到预测错误的观测。 建模过程: 第1次抽样:各观测被抽到的概率相等,都是1/n,建立第1棵树,对数据进行预测,计算此时模型的...

2018-09-13 15:48:55 380

原创 组合预测模型:bagging

基本思想 通过Bootstrap抽样(0.632自举法),对样本量为n的样本,做k次有放回重复抽样,得到k个样本容量仍为n的随机样本Si,基于样本Si,建立k棵分类回归树,即k个预测模型。 对于分类问题,采用k个预测模型“投票”和“少数服从多数”的原则。哪个类别“得票”最多,就预测为哪个类别。对于回归问题,以k个预测模型给出的预测值的平均值作为最终的预测值。 若令k个预测模型为所有观测投票预...

2018-09-13 13:11:19 6814

原创 决策树

1、基本思想: 忽略对数据分布的要求,找出输入变量和输出变量取值间的逻辑对应关系并实现对新数据输出变量的预测。包括分类树和回归树。分类树:通过对特征空间的划分,使得同一区域中样本输出变量尽可能取同一类别值。回归树:通过对特征空间的划分,即同一区域中样本输出变量取值的离散程度应尽可能低。2、两大问题:2.1 树的生长,即利用训练样本集完成决策树的建立过程。决策树生长伪代码:...

2018-09-11 16:49:29 1498

原创 KNN

1、基本思想: 将样本包含的n个观测数据看成p维(p个输入变量)特征空间中的点,为预测一个新观测X0输出变量y0的取值,首先在已有数据中找到与X0相似的K个观测,如(X1, X2, …, Xk),这些观测称为X0的近邻。对于分类问题,预测值应为最大概率值对应的分类;对于回归预测问题,是近邻输出变量的平均值。 核心问题:依据怎么的标准选择近邻?选择几个近邻(k如何确定)?...

2018-09-07 15:31:50 1683 1

原创 Anaconda下更新Spyder

进入Anaconda Prompt 更新Anaconda: conda update anaconda 下面的提示 输入y: Proceed ([y]/n)? y 更新Spyder: conda update spyder

2018-09-07 11:09:31 3667 1

原创 用R绘制几个常见的统计描述图

直方图 单个直方图:mycol <- c("#377EB8","#FF7F00","#4DAF4A") #定义颜色变量p0 <- ggplot(data=dt1,aes(x=index1))+ geom_histogram(fill = mycol[1],posit

2018-09-03 18:08:36 3276

原创 统计分析及建模小结(1)

1.预分析 1.1 统计描述集中趋势:均值、中位数 ;众数、频数离散趋势:方差、标准差、百分位数、全距图:分组直方图、散点图、箱图 1.2 统计推断 2.分析 2.1 假设检验 2.1.1 两类错误 2.1.2 参数检验 前提:独立性: 研究设计阶...

2018-09-03 17:30:00 1166

RdfSnap300_V3.0.0.0_Setup

红蜻蜓抓图精灵(RdfSnap)是一款国内的完全免费的专业级屏幕捕捉软件截图工具,能够让您得心应手地捕捉到需要的屏幕 截图。

2017-02-13

AxureRP_8.0.0.3605_Setup

Axure RP是一个专业的快速原型设计工具

2017-02-13

firefox安装包

firefox安装包

2015-03-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除