自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 化学分子的溶解度预测模型(Rdkit构建)

各位朋友好,今天我讲述如何用Rdkit构建化学分子的溶解度预测模型。首先我们要了解一个非常重要的包Rdkit。Rdkit介绍•Rdkit是开源的化学信息工具包•采用了进行封装,提供Python2/Python3的接口•通过SWIG技术提供Java 和C# 接口•提供了大量对化学分子2D/3D的计算操作•生成用于机器学习的分子描述商业友好的BSD协议•核心数据结构和算法用C++实现•通过Boost.Python技术对RDKit符•基于PostgreSQL搭建分子数.

2021-06-15 14:25:57 13120 10

原创 非平衡数据(imbalanced data)简单介绍

不平衡分类是指分类预测建模问题,其中每个类标签的训练数据集中的示例数量不平衡。也就是说,类分布不等于或接近等于,而是有偏差或偏斜。不平衡分类问题是分类问题的一个示例,其中已知类中的示例分布有偏差或偏斜。分布可以从轻微的偏差到严重的不平衡,其中少数类中有一个示例,而多数类中有数百、数千或数百万个示例。不平衡的分类对预测建模提出了挑战,因为大多数用于分类的机器学习算法都是围绕每个类的示例数量相等的假设设计的。这会导致模型的预测性能不佳,特别是对于少数类。这是一个问题,因为通常少数类更重要,因此问题对少数

2021-06-15 11:26:44 6148 6

原创 消费者人群画像-信用智能评分(风控模型竞赛经典案例)

概述该项目是中国移动公司举办模型竞赛项目,奖金百万。赛题信息随着社会信用体系建设的深入推进, 社会信用标准建设飞速发展,相关的标准相继发布,包括信用服务标准、信用数据釆集和服务标准、信用修复标准、城市信用标准、行业信用标准等在内的多层次标准体系亟待出台,社会信用标准体系有望快速推进。社会各行业信用服务机构深度参与广告、政务、涉金融、共享单车、旅游、重大投资项目、教育、环保以及社会信用体系建设,社会信用体系建设是个系统工程,通讯运营商作为社会企业中不可缺少的部分同样需要打造企业信用评分体系,助.

2021-06-14 15:40:54 11709 2

原创 模型竞赛大杀器-(stacking)融合模型

一套弱系统能变成一个强系统吗?当你处在一个复杂的分类问题面前时,金融市场通常会出现这种情况,在搜索解决方案时可能会出现不同的方法。 虽然这些方法可以估计分类,但有时候它们都不比其他分类好。 在这种情况下,合理的选择是将它们全部保留下来,然后通过整合这些部分来创建最终系统。 这种多样化的方法是最方便的做法之一:在几个系统之间划分决定,以避免把所有的鸡蛋放在一个篮子里。一旦我对这种情况有了大量的估计,我怎样才能将N个子系统的决策结合起来? 作为一个快速的答案,我可以做出平均决定并使用它。 但是,是否..

2021-06-12 14:00:47 2638 3

原创 风控中英文术语手册(银行_消费金融信贷业务)_v4

1、风控系统部分1.Blazeblaze是FICO公司产品,用于规则管理,是模型ABC卡开发的前身。信贷公司开始放贷时,数据量少,申请用户少,难以建立模型。因此前期一般会用到专家经验判断好坏客户,然后通过风控决策管理系统进行高效作业,其中blaze就是一款应用多年,效率较高风控决策管理系统。但blaze属于商业产品,一般多应用于大银行,捷信等大型消费金融公司,收费可高于100万RMB每年,如果需要更多定制业务,收费更高。1.1 A card释义:Application scorecard 申.

2021-06-12 13:41:20 3538 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除