自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

CFK0104的专栏

SAS 数据挖掘 Hadoop HIve Hbase Mahout

  • 博客(14)
  • 资源 (2)
  • 收藏
  • 关注

原创 电销数据管理系统

@Shiny账户与密码&电销系统登录界面# 客户分期名单导出# 电销拨打历史导入

2019-08-18 23:05:41 1741 1

原创 Lending Club Data For Scorecard Development in SAS Enterpise Miner

构建分类和组合模型单一模型神经网络Logistic回归决策树(Entropy、Chisq)随机森林梯度Boosting组合模型Simple Average EnsembleStack EnsembleTopT EnsembleHill Climbing Ensemble模型流程图构建单一模型构建集成模型模型对比单一模型对比集成模型对比...

2018-11-19 13:38:28 469

原创 Lending Club Data For Scorecard Development in SAS Enterpise Miner

Lending@TOC欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:全新的界面设计...

2018-11-19 13:12:54 608

原创 Lending Club Data For Scorecard Development in SAS Enterpise Miner

评分卡模型预测变量测试在构建评分卡之前,可以尝试使用神经网络、决策树和随机森林对目标变量和解释变量进行建模,构建一个复杂的模型作为参考。决策树ods graphics on;proc hpsplit data=RawDS seed=123 ASSIGNMISSING=BRANCH ; class &_char_var. Target_Loan; model Target_Loa...

2018-11-18 06:26:57 701

原创 Lending Club Data For Scorecard Development in SAS Enterpise Miner

数据准备(Data Preparation)构建SAS、R和MySQL运行环境数据准备的思路是通过R直接读取压缩文件,然后合并成一个单一文件,并存储结果到MySQL数据库。代码解析/*检查配置SAS运行R的Conf*/PROC options option=Rlang;RUN;PROC iml; submit /R; library(dplyr) library(readr)...

2018-11-18 06:01:02 389

原创 Lending Club Data For Scorecard Development in SAS Enterpise Miner

数据挖掘流程CRISP-DM是数据挖掘过程模型的主要行业方法,由六个相互关联的阶段组成:(1)商业目标(2)数据理解(3)数据准备(4)数据建模(5)模型评估(6)模型部署图1:CRISP-DM框架...

2018-11-18 01:54:16 730

翻译 模型融合-最新进展和应用 (SAS Enterprise Miner)

模型融合:最新进展和应用摘要模型融合是一种流行的方法,其用于组合两个或更多预测模型的后验概率,以创建更准确的模型。本文总结了近期集中技术的理论背景,并介绍实际应用的实例。这些新颖的融合技术的实例包括了通过一次添加一个模型来组合后验概率的平均或投票方法之外的预测概率的加权(诸如堆叠或混合)。比较了几个数据集的拟合统计数据,以此来突出每种方法的优缺点,并提供可用作SAS Entrprise...

2018-08-11 09:35:16 2376 1

原创 Shiny App

信用卡评分http://101.236.39.51:8080/credit/ 台账系统http://101.236.39.51:8080/book/

2018-01-29 20:35:40 723

原创 # 公益数据爬虫本

公益数据爬虫本代码# -*- coding: utf-8 -*-"""Created on Sat Jan 27 21:56:47 2018@author: caofk"""from selenium import webdriverfrom pyquery import PyQuery as pqfrom selenium.webdriver.common.action_chains i

2018-01-28 12:40:39 588 1

原创 Ocr with abbyyR

下载packageinstall.packages("abbyyR")## devtools::install_github('soodoku/abbyyR')library(abbyyR)# 设置工程目录project.dir <- "E:/Temp/"rm(list = ls())抓取图片library(rvest)library(dplyr)url = "http://www.c-

2017-09-01 17:05:05 503

原创 51 Job招聘数据分析与可视化

招聘数据分析与可视化背景为了分析现有数据行业的招聘情况,抓取2017年3月14日到2017年5月13日发布在51Job上的数据相关招聘职位116273条信息,并从中筛选出职位是数据分析、数据挖掘、文本挖掘、视觉学习、计算广告、数据开发、数据架构师等的数据岗位招聘信息10134条。 从地域分布、企业情况、岗位需求、薪酬等维度去量化分析数据岗位的招聘现状。发现不同薪酬分层下的岗位数量基本与城市发展趋势

2017-08-31 09:33:56 5992 5

原创 虎嗅网数据爬取(Scrapy Splash)

huxiu_spider.py提取当前网页的所有article链接,通过解析artile内部的推荐文章(Splash动态爬取)进行跟踪爬去。 ···!/usr/bin/env python-- encoding: utf-8 --“”” Topic: 爬取虎嗅网首页 Desc : “”” import logging import scrapy from coolscrapy.ite

2017-08-30 14:57:24 1715

原创 Twitter数据获取

推文获取申请Twitter API注册Twitter账号https://dev.twitter.com/apps, 点击create apps。点击确定完成在Application Management的Keys and Access Tokens,点击Generate Access Token.利用tweepy获取特朗普最近推文# -*- coding: utf-8 -*-"""Cre

2017-01-08 18:35:39 3066 2

原创 SAS Macro

SAS的宏文本替代功能, 同样的两段程序, 实现的是同样的功能.%let numVar = 6; *输入你所需要的变量个数; %MACRO arrayInput;       DATA array;            array var{&numVar} &varx_1-&&varx_&numVar;                do i = 1 to &numV

2014-11-29 01:08:59 1661

R H2O 价格预测

R代码实例,利用H2O构建线性回归模型,对数线性回归模型,随机森林,梯度Boosting,然后对模型进行ROC,AUC比较,选择最优模型。

2018-04-20

FICO 零售评分卡决策引擎培训

强大的模板功能,无论规则简单或复杂,均可模板化管理 » 规则功能组件 » 各个模块高度灵活,在零售银行业务有广泛验证 » 高性能 » 提供调额等所必要的高效批处理接口,专利算法RETEIII,业内性能评测第一 » 智能规则管理 » 提供十余种、业内最全的规则检验方式 » 规则生命周期管理 » 完整规则生命周期管理,并可以按需求定制化 » 用户安全管理模式 » 支持按产品、区域、职能等的用户权限管理 » 技术开放性和可扩展性 » 为业务人员提供B/S操作方式,支持外部数据库或其它接口调用

2018-04-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除