![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
projects
虎皮猫大R
TO do something with data
展开
-
信用评分卡模型 —— 基于Lending Club数据
1、前言Lending Club是全球最大的撮合借款人和投资人的线上金融平台,它利用互联网模式建立了一种比传统银行系统更有效率的、能够在借款人和投资人之间自由配置资本的机制。本次分析的源数据基于Lending Club 2017年全年和2018年一二季度的公开数据,目的是建立一个贷前评分卡。数据原址:https://www.lendingclub.com/info/download-data.a...原创 2019-01-03 18:01:02 · 17215 阅读 · 36 评论 -
成都二手房长啥样 —— 基于链家数据
下面的分析的源数据是从链家网上抓取的成都二手房数据,截至时间2019年1月16日。目的也简单,一个想买房的人关注一下所在城市的房价情况。需要注意的问题:只含普通住房, 不含公寓、别墅链家网上只有成都一、二圈层的二手房信息(缺乏三圈层的数据),共52548条不同区域下面有重复的商圈,抓取数据时注意去重和商圈的正确归属商圈直接划分错误,比如犀浦归到了新都一些较远的区县归属到了相邻的区域内...原创 2019-01-17 20:14:46 · 2096 阅读 · 0 评论 -
Elo顾客忠诚度 —— kaggle数据
前言这个项目来自Kaggle,是Elo(巴西最大的本土支付品牌之一)和Kaggle合作的比赛,通过Elo的匿名数据集预测每个客户的忠诚度(具体到card_id),以及查找影响客户忠诚度的因素。这个是数据集是虚构的(官方是这么说的),而且部分变量都经过匿名处理,并不清楚具体何意(保密工作相当到位)。整个数据集包含以下的数据,historical_transactions: 每个card_id...原创 2019-01-10 17:56:44 · 3530 阅读 · 6 评论 -
游戏付费金额 —— 基于DC游戏数据(Brutal Age)
背景“《野蛮时代》(Brutal Age)是一款风靡全球的SLG类型手机游戏。根据App Annie统计,《野蛮时代》在12个国家取得游戏畅销榜第1,在82个国家取得游戏畅销榜前10。准确了解每个玩家的价值,对游戏的广告投放策略和高效的运营活动(如精准的促销活动和礼包推荐)具有重要意义,有助于给玩家带来更个性化的体验。因此,我们希望能在玩家进入游戏的前期就对于他们的价值进行准确的估算。在这个竞...原创 2019-01-30 17:05:25 · 2635 阅读 · 8 评论 -
Human Resources Analytics -- Kaggle Dataset
1 IntroductonThe Human Resources Analytics is a simulated dataset and the focus is to understand why the best and most experienced employees is leaving the company. We will explore the fact why emplo...原创 2019-03-04 17:13:18 · 1156 阅读 · 0 评论