自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

kaggle expert,全球排名前1000,清华计算机研究生,兴趣算法工程

kaggle expert,全球排名前1000,清华计算机研究生,兴趣算法工程

  • 博客(54)
  • 资源 (4)
  • 收藏
  • 关注

原创 信贷风控技术十分钟精通6(特征提取)

基于业务专家经验定义特征是特征工程重要的内容,虽然现在特征工程相关的开源工具越来越多,但不可否认专家经验仍然是非常宝贵的。基于专家经验定义的特征,能更有效地反映业务特征和风险特征,且所提取的特征的可解释性更强,使得模型的预测效果更好。虽然通过业务专家经验来定义特征非常重要,但很难有一套标准且明确的规则和方法,很难形成一套标准的方法论,很多时候是依靠点滴经验的积累,或者是对于特定风险点的敏锐洞察,需要长久的经验积累,也依赖于悟性和敏锐感知力,甚至只可意会不可言传,更像是一门艺术而非技术。

2024-02-09 09:01:07 1084

原创 信贷风控技术十分钟精通5(特征处理)

通常在给定的数据表中,变量特征可能会存在一定的错误、缺失、异常等情况,需要进行特征预处理和转换。

2024-02-09 08:41:11 921

原创 信贷风控技术十分钟精通4(特征工程1)

数据和特征决定了模型性能的上限,特征工程是建模最关键的环节,依赖于分析建模人员对业务和数据的深刻理解,对特征工程理论方法的应用,以及对多种高效特征工程技术和工具的灵活应用。

2024-02-08 21:46:49 1061

原创 信贷风控技术十分钟精通3(数据质量)

在建模之前需要对数据进行探索和数据质量诊断

2024-02-08 18:29:45 444

原创 信贷风控技术十分钟精通2(信贷大数据)

小数据大数据收集目的小数据是为特定的、明确的分析目标,制订规划并进行收集、整理、分析的数据,数据与分析目标之间有强逻辑业务关系,小数据亦称强关联数据大数据不一定有明确的分析目标,收集数据范围更广,与业务的关联性弱,大数据亦称弱关联数据数据结构来自不同行业领域,种类复杂,标准和格式种类单一、结构统一,一般是结构化数据一般以非结构化数据、半结构化数据为主生命周期比较短,几乎只有几年时间,待相关问题解决之后,生命周期结束生命周期可以很长,甚至会永久保存分析方法。

2024-02-08 10:54:29 1272

原创 信贷风控技术十分钟精通1(数据)

模型效果和质量的影响因素包括数据的质和量、特征工程质量、模型设计方案等,其中数据的质和量无疑是最具决定性和基础性作用的,所谓“巧妇难为无米之炊”,如果数据的信息域、样本量和信息维度不足,或者数据本身并不具备预测力,则很难建立有效的预测模型。这里将从源数据角度介绍建模的数据基础以及对建模的影响。

2024-02-08 06:35:03 1336

原创 信贷业务与风险管理十分钟入门到精通6

在开始分析和建模之前,正确定义问题很重要,只有正确定义问题,才能确保“看透本质”和“方向正确”。在日常生活和工作中,人们常犯的错误是定义了错误的问题,即定义的问题并非核心问题,未能抓住问题本质,因此不能有效解决问题。方向正确比努力更重要,如果从一开始就没能正确地定义问题,后续所有的努力都是在错误的方向上越走越远。定义了正确的问题,就抓住了问题的症结。对症下药,才能做到药到病除。在建模前应思路清晰,多问为什么,多思考提出这个需求的原因和依据是什么,是否满足了所提的需求就一定能解决业务所面临的问题。

2024-02-07 20:21:28 842

原创 信贷业务与风险管理十分钟入门到精通5

信用风险的核心来源是信息不对称,而征信就是让专业、独立的第三方机构为企业或个人建立信用档案,依法采集、客观记录其信用信息,并依法对外提供信用信息服务的一种活动,它为专业化的授信机构提供了信用信息共享平台。

2024-02-07 19:06:12 1100

原创 信贷业务与风险管理十分钟入门到精通4(风险管理)

信用卡业务涉及发卡行、收单行、清算机构等,所包含的风险非常复杂。

2024-02-07 10:30:57 993

原创 信贷业务与风险管理十分钟入门到精通3(信用卡业务知识)

信用卡是记录持卡人账户信息,具备授信额度和透支功能,并为持卡人提供相关银行服务的各类介质,具有消费支付、分期付款、转账结算、存取现金等全部或部分功能。经过几十年的发展,信用卡产品已经很成熟,并衍生出多种产品形态,特别是在20世纪80年代信用卡引人中国后,衍生出了很多具有中国特色的产品形态。

2024-02-07 09:58:52 541

原创 信贷业务与风险管理十分钟入门到精通2(个人信贷业务流程)

可以分为前端渠道、营销获客、申请受理、贷前调查、贷前审查、贷款审批、贷中签约、支付发放、贷款回收、贷后管理这样的业务流程。

2024-02-07 08:49:44 1402

原创 信贷业务与风险管理十分钟入门到精通1

与其他领域的预测建模相比,金融风险建模有其特殊性,要求风险建模分析师对金融业务,特别是金融风险有深入的理解,包括但不限于对产品特征、信贷政策、业务流程、风险特征等的理解.

2024-02-06 22:05:29 942 2

原创 信贷风控业务十分钟速学3——评分卡建模基础(3)

评分卡建模涉及多个环节,覆盖评分卡模型全生命周期。

2024-02-02 21:27:50 382

原创 信贷风控业务十分钟速学2——评分卡建模基础(2)

相对而言,评分卡模型在客观性、一致性、效率产能、知识经验可传承性、统一管理控制方面具有优势。

2024-02-02 21:12:39 503

Spark入门.docx

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。

2020-04-02

人手一份核武器 - Hacking Team 泄露(开源)资料导览手册 _ WooYun知识库.pdf

事先声明本人并不是全栈安全工程师,仅仅是移动安全小菜一枚,所以对泄漏资料的分析难免会有疏忽或着错误,望各位围观的大侠手下留情。 首先来看安全界两大元老对Hacking Team(以下简称HT)被黑这个事件的看法: @tombkeeper: Stuxnet 让公众知道:“原来真有这种事”,Snowden 让公众知道:“原来这种事这么多”,Hacking Team 让公众知道:“原来这种事都正经当买卖干了”

2020-03-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除