![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
Bonus_F
To move the world with data
展开
-
Pyhon轻松实现大数据风控模型开发-toad库
前言同业小伙伴都知道信贷风控界有一个库叫做Scorecardpy,作者是谢士晨博士,就不在赘述。今天为读者介绍另一个同样用于开发评分卡的标标准化评分卡建模模块---toad库:toad是由厚本金融风控团队内部孵化,后开源并坚持维护的标准化评分卡开发库。其功能全面、性能稳健、运行速度快、问题反馈后维护迅速、深受同行喜爱。toad库可实现标准化的信用评分开发,极大简化我们的建模构建和缩短建模周期,只介绍toad库做评分卡模型框架,详细内容请拿数据自己模拟调试,因为作者也比较懒。#!/usr/bi原创 2021-03-11 10:47:46 · 2422 阅读 · 0 评论 -
python pandas常用语法与实操
前言由于工作的原因,现在使用R较少,使用Python的频率较高,将给大家分享在工作中用到python使用技巧和相关的代码。安装Anaconda64, 推荐使用jupyter notebook或者Spyder来做数据分析和建模,开发建议使用Pycharm1、安装pandaswin+R---->cmd , 或者从Anaconda Prompt启动安装pip install ...原创 2019-07-05 19:33:27 · 1707 阅读 · 1 评论 -
python ---测算代码运行时间
前言为了提高代码的运行效率,需要测算每一步的运行时间。####jupyter notebook 版本1.单次运行时间%%timemuch_job = [x**2 for x in range(1,10000000,4)]2.测算代码多次运行平均时间%%timeit -n 10g= lambda x:x**3+3def main(): return(g(2)...原创 2019-07-11 11:14:46 · 450 阅读 · 0 评论 -
大数据风控---互信息及Python实现
前言信息增益表示得知特征空间X的信息而使得类Y的信息不确定性减少的程度。信息增益依赖于特征,不同的特征往往具有不同的信息增益,信息增益大的特征具有更强的分类能力。在概率论和信息论中,两个随机变量的互信息(Mutual Information,简称MI)或转移信息(transinformation)是变量间相互依赖性的量度;不同于相关系数,互信息并不局限于实值随机变量,它更加一般且决定着联合分布...原创 2019-07-22 18:44:57 · 12592 阅读 · 5 评论 -
Python---快速入手pandas进行数据分析
前言不废话,直接盘加载模块import pandas as pdimport numpy as np导入数据 pd.read_csv(filename,dtype=str):从CSV文件导入数据 [header=1,delim_whitespace=True,delimiter="\t",parse_dates=['OCC_TIM'],error_bad_l...转载 2019-07-30 09:51:12 · 371 阅读 · 0 评论 -
R & Python 功能模块对比
前言作为一个统计出身,对R其实是情有独钟的;但近2年因为工作需要接触到Python,只想说Python在公司运营实践中真的灵活好用,建模和模型部署都非常的棒。R语言更多偏向学术和教学,Python与java、C++等兼容性更好,使得Python的使用率更高。其实楼主见过很多统计大咖,他们都用C语言来写计算逻辑的,不服不行。1.功能模块2.算法模块...原创 2019-07-26 11:00:08 · 264 阅读 · 0 评论 -
140种Python标准库、第三方库和外部工具模块
前言信息量过于庞大,只能上链接;可以点击进去按照需求,ctr+F进行检索查询。原文链接:https://mp.weixin.qq.com/s/Qp12DRURa2I9AVjQ7gpxVw转载 2019-07-26 11:17:07 · 221 阅读 · 0 评论 -
Python 内置函数 filter()、map()、reduce()的使用对比
前言filter(), map(), reduce()三个内置函数在我们数据过滤、清洗和映射中发挥着重要的作用1.filter(function, iterable)function -- 判断函数。 iterable -- 可迭代对象。你可以把 filter 当成一个过滤器,用来选择原来 list 中满足特定条件的 valuedef f(x): return x %...原创 2019-07-09 21:18:25 · 381 阅读 · 0 评论 -
Python数据分析---Mysql数据库连接
前言Python 连接数据库是我们公司级做数据分析的基础1.SQLAlchemySQLAlchemy是一个“pythonSQL工具包和对象关系映射器”(ORM),目的是当使用SQL数据库工作时会使事情变得简单起来。#step1:加载模块import pandas as pdimport MySQLdbimport pandas.io.sql as psql#step2...原创 2019-07-12 17:27:40 · 626 阅读 · 0 评论 -
Python DataFrame基本操作总结
前言python中DataFrame是我们进行数据分析和建模过程中使用度最频繁的1.构建DataFramepandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)data:numpy ndarray(结构化或同类),dict或DataFrame,Dict可以包含Series,数组,常量...原创 2019-07-09 14:50:13 · 2459 阅读 · 0 评论 -
Python 数据顺序和分位数排序等分成20分
前言数据切分#方法1:#随机生成0-100的整数number=[]for i in range(0, 100): # 3.生成随机数 num = np.random.randint(0,100) # 4.添加到列表中 number.append(num)print(number)#切分成等分20份number1=pd.qcut(number,...原创 2019-07-09 15:07:12 · 5156 阅读 · 0 评论 -
Python Numpy常用使用技巧
前言NumPy是一个功能强大的Python库,主要用于对多维数组执行计算。NumPy这个词来源于两个单词--Numerical和Python。NumPy提供了大量的库函数和操作,可以帮助使用者轻松地进行数值计算。这类数值计算广泛用于以下任务: 机器学习模型:在编写机器学习算法时,需要对矩阵进行各种数值计算。例如矩阵乘法、换位、加法等。NumPy提供了一个非常好的库,用于简单(在编写代码...原创 2019-07-09 11:37:48 · 479 阅读 · 0 评论