- 博客(14)
- 资源 (2)
- 收藏
- 关注
原创 Lending Club Data For Scorecard Development in SAS Enterpise Miner
构建分类和组合模型单一模型神经网络Logistic回归决策树(Entropy、Chisq)随机森林梯度Boosting组合模型Simple Average EnsembleStack EnsembleTopT EnsembleHill Climbing Ensemble模型流程图构建单一模型构建集成模型模型对比单一模型对比集成模型对比...
2018-11-19 13:38:28 470
原创 Lending Club Data For Scorecard Development in SAS Enterpise Miner
Lending@TOC欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:全新的界面设计...
2018-11-19 13:12:54 615
原创 Lending Club Data For Scorecard Development in SAS Enterpise Miner
评分卡模型预测变量测试在构建评分卡之前,可以尝试使用神经网络、决策树和随机森林对目标变量和解释变量进行建模,构建一个复杂的模型作为参考。决策树ods graphics on;proc hpsplit data=RawDS seed=123 ASSIGNMISSING=BRANCH ; class &_char_var. Target_Loan; model Target_Loa...
2018-11-18 06:26:57 701
原创 Lending Club Data For Scorecard Development in SAS Enterpise Miner
数据准备(Data Preparation)构建SAS、R和MySQL运行环境数据准备的思路是通过R直接读取压缩文件,然后合并成一个单一文件,并存储结果到MySQL数据库。代码解析/*检查配置SAS运行R的Conf*/PROC options option=Rlang;RUN;PROC iml; submit /R; library(dplyr) library(readr)...
2018-11-18 06:01:02 391
原创 Lending Club Data For Scorecard Development in SAS Enterpise Miner
数据挖掘流程CRISP-DM是数据挖掘过程模型的主要行业方法,由六个相互关联的阶段组成:(1)商业目标(2)数据理解(3)数据准备(4)数据建模(5)模型评估(6)模型部署图1:CRISP-DM框架...
2018-11-18 01:54:16 734
翻译 模型融合-最新进展和应用 (SAS Enterprise Miner)
模型融合:最新进展和应用摘要模型融合是一种流行的方法,其用于组合两个或更多预测模型的后验概率,以创建更准确的模型。本文总结了近期集中技术的理论背景,并介绍实际应用的实例。这些新颖的融合技术的实例包括了通过一次添加一个模型来组合后验概率的平均或投票方法之外的预测概率的加权(诸如堆叠或混合)。比较了几个数据集的拟合统计数据,以此来突出每种方法的优缺点,并提供可用作SAS Entrprise...
2018-08-11 09:35:16 2386 1
原创 Shiny App
信用卡评分http://101.236.39.51:8080/credit/ 台账系统http://101.236.39.51:8080/book/
2018-01-29 20:35:40 726
原创 # 公益数据爬虫本
公益数据爬虫本代码# -*- coding: utf-8 -*-"""Created on Sat Jan 27 21:56:47 2018@author: caofk"""from selenium import webdriverfrom pyquery import PyQuery as pqfrom selenium.webdriver.common.action_chains i
2018-01-28 12:40:39 589 1
原创 Ocr with abbyyR
下载packageinstall.packages("abbyyR")## devtools::install_github('soodoku/abbyyR')library(abbyyR)# 设置工程目录project.dir <- "E:/Temp/"rm(list = ls())抓取图片library(rvest)library(dplyr)url = "http://www.c-
2017-09-01 17:05:05 504
原创 51 Job招聘数据分析与可视化
招聘数据分析与可视化背景为了分析现有数据行业的招聘情况,抓取2017年3月14日到2017年5月13日发布在51Job上的数据相关招聘职位116273条信息,并从中筛选出职位是数据分析、数据挖掘、文本挖掘、视觉学习、计算广告、数据开发、数据架构师等的数据岗位招聘信息10134条。 从地域分布、企业情况、岗位需求、薪酬等维度去量化分析数据岗位的招聘现状。发现不同薪酬分层下的岗位数量基本与城市发展趋势
2017-08-31 09:33:56 6000 5
原创 虎嗅网数据爬取(Scrapy Splash)
huxiu_spider.py提取当前网页的所有article链接,通过解析artile内部的推荐文章(Splash动态爬取)进行跟踪爬去。 ···!/usr/bin/env python-- encoding: utf-8 --“”” Topic: 爬取虎嗅网首页 Desc : “”” import logging import scrapy from coolscrapy.ite
2017-08-30 14:57:24 1716
原创 Twitter数据获取
推文获取申请Twitter API注册Twitter账号https://dev.twitter.com/apps, 点击create apps。点击确定完成在Application Management的Keys and Access Tokens,点击Generate Access Token.利用tweepy获取特朗普最近推文# -*- coding: utf-8 -*-"""Cre
2017-01-08 18:35:39 3077 2
原创 SAS Macro
SAS的宏文本替代功能, 同样的两段程序, 实现的是同样的功能.%let numVar = 6; *输入你所需要的变量个数; %MACRO arrayInput; DATA array; array var{&numVar} &varx_1-&&varx_&numVar; do i = 1 to &numV
2014-11-29 01:08:59 1663
FICO 零售评分卡决策引擎培训
2018-04-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人