自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(133)
  • 收藏
  • 关注

转载 一张万能数据集教你快速盘点零售信贷项目资产情况——零售风险政策人员必备基础技能...

本文重点介绍一个零售风险策略分析人员常用的万能数据集,把万能数据集放到excel中,可以快速透视出常见的vintage报表、各种迁徙率趋势、余额衰减趋势、各月常规的运营指标放款趋势等,如果乐于在excel写公式,发挥余地更大,基本可以应对不少测算类的数据需求。当入职任何一个新公司或者接手一个贷款新项目后,有了这套数据集市,也可以帮助快速了解整个公司或者所在项目资产情况。本文也提...

2023-06-12 20:19:59 366

转载 一张万能数据集教你快速盘点零售信贷项目资产情况——零售风险政策人员必备基础技能...

本文重点介绍一个零售风险策略分析人员常用的万能数据集,把万能数据集放到excel中,可以快速透视出常见的vintage报表、各种迁徙率趋势、余额衰减趋势、各月常规的运营指标放款趋势等,如果乐于在excel写公式,发挥余地更大,基本可以应对不少测算类的数据需求。当入职任何一个新公司或者接手一个贷款新项目后,有了这套数据集市,也可以帮助快速了解整个公司或者所在项目资产情况。本文也提...

2023-06-12 20:19:59 116

转载 一张万能数据集教你快速盘点零售信贷项目资产情况——零售风险政策人员必备基础技能...

本文重点介绍一个零售风险策略分析人员常用的万能数据集,把万能数据集放到excel中,可以快速透视出常见的vintage报表、各种迁徙率趋势、余额衰减趋势、各月常规的运营指标放款趋势等,如果乐于在excel写公式,发挥余地更大,基本可以应对不少测算类的数据需求。当入职任何一个新公司或者接手一个贷款新项目后,有了这套数据集市,也可以帮助快速了解整个公司或者所在项目资产情况。本文也提...

2023-06-12 20:19:59 104

转载 一张万能数据集教你快速盘点零售信贷项目资产情况——零售风险政策人员必备基础技能...

本文重点介绍一个零售风险策略分析人员常用的万能数据集,把万能数据集放到excel中,可以快速透视出常见的vintage报表、各种迁徙率趋势、余额衰减趋势、各月常规的运营指标放款趋势等,如果乐于在excel写公式,发挥余地更大,基本可以应对不少测算类的数据需求。当入职任何一个新公司或者接手一个贷款新项目后,有了这套数据集市,也可以帮助快速了解整个公司或者所在项目资产情况。本文也提...

2023-06-12 20:19:59 98

转载 发展横向关系,“存在于这里,就已经对他人有用、有价值了”

人际关系的起点是“课题分离”,终点是“共同体感觉”。1、批评不好……表扬也不行?青年:哎呀,好吧。但是,您注意到了吗?先生您并没有说到关键问题,也就是从“课题分离”到“共同体感觉”发展的路线。首先是分离课题。我的课题就到这里,从这里开始属于他人的课题。划清界限,我不去干涉别人的课题,也不让别人干涉我的课题。那么,如何从这种“课题分离”中建立人际关系,最终形成“可以在这里”的共同体感觉呢?阿...

2023-03-30 22:47:54 201

转载 把自己和别人的“人生课题”分开

1、把自己和别人的“人生课题”分开来哲人:例如,有一个不爱学习的孩子,不听课、不写作业甚至连教科书都忘在学校。那么,如果你是父母的话,你会怎么做呢?青年:当然是想尽一切办法地让其学习呀!上辅导班、请家庭教师,有时候甚至还可能会扯耳朵。这就是父母的责任和义务吧。实际上我就是这样长大的——做不完当天的作业,父母就不让吃晚饭。哲人:那么,我再问你一个问题。被这种强制性的手段强迫学习,那你最终喜欢上学习了...

2023-03-30 22:47:54 412

转载 读书笔记---阶级逆袭——三代人的卵巢彩票

现实比较残酷,一个生物出生就决定了它处于生物链的那个环节,大鱼吃小鱼,小鱼吃虾米。人和国家也是一样的。学者贾雷德·戴蒙德研究了一个课题《为什么的国家富裕,有的国家贫穷》,...

2021-03-15 23:37:58 509

转载 目标感强的人如何让自己平衡

行动力、目标力、执行力是经常一起出现,解释下三者的区别:行动力是从微观上看执行,它是一种当下就做,毫不犹豫的特质。目标力是从中观看执行,它是指一段时间里,比如一周、半年、一年的时间里紧盯目...

2021-03-15 23:37:58 801

转载 读书笔记--贫穷的本质及贫穷的陷阱

什么是贫穷陷阱?贫穷的根源是什么?什么样的人会一直穷下去?只有搞懂这些本质问题,我们才能走出贫穷,变得rich。首先,给大家讲个我自己的日常观察:大概在5年前,...

2021-01-16 22:32:18 1109

原创 搜索小技巧分享,快速定位所需

学会工具和技巧不是我们的最终目的,用工具和技巧高效解决问题才是我们的目标。本文我们介绍几个浏览器搜索小技巧以及附赠几个数据常用网址:【技巧一:限定搜索网址】:搜索词+空格+sit...

2020-06-14 20:36:27 477

原创 免费!!这个爬虫小工具教你3分钟把“风险政策分析”职位全捞取出来

爬虫一听就头大,高科技啊,python学了,好久不用,忘记的快;别急,今天又发现一款好工具,就教你3分钟,爬取所有想要的职位数据;小白傻瓜操作,完全压力;步骤1:电脑下载后羿采集...

2020-06-12 22:06:45 490

原创 数据透视表设置条件格式,且刷新时格式不消失

设置条件格式很简单,设置数据透视表中的条件格式你有做过吗?如果没有做过,那么赶紧尝试一下再尝试重新选择一个维度,或者刷新一下,那么你就会碰到,一刷新,原来设置好的格式就消除的尴尬。问题重...

2020-03-05 14:17:17 17104 5

原创 逻辑回归中常用的概念: WOE、IV详解

为了挑选并构造出对目标变量有较高预测力的自变量,需要对变量进行WOE编码,通过IV值的看变量的贡献。1、WOE(weight of Evidence 证据权重)...

2019-08-16 17:05:46 21445 1

原创 ​建模知识3:lift图、Gini图

1、先列出混淆矩阵一个二分问题,即将实例分成正类(positive)或负类(negative)。对一个二分问题来说,会出现四种情况。如果一个实例是正类并且也被 预...

2019-08-16 17:05:46 2382 1

原创 建模知识2: ROC、AUC、K-S曲线

1、混淆矩阵(confusion matrix)一个二分问题,即将实例分成正类(positive)或负类(negative)。对一个二分问题来说,会出现四种情况。...

2019-08-16 17:05:46 3336 2

原创 聚类分析理论介绍

1、聚类分析概述及基本思想    聚类分析(cluster analysis)也称群分析、点群分析,是一种无监督学习,与回归分析、多元分析称为多元分析的三大方法。是一个把...

2018-12-02 11:02:36 11258

原创 年金、净现值NPV、IRR、现值PV、终值FV、EAR等常见概念

  1、各种基本概念:    资金是有时间价值的,比如我们卖出去一笔货,总是希望尽快提前收到货款,今年的钱仅仅因为通货膨胀,也会比明年同等金额的钱更值钱。    1)资金...

2018-06-30 13:17:14 105362 5

转载 写给2018年5月的自己

       每两个月一总结,这两个月最大的感触就是,习惯形成要至少3个月,但是习惯的破坏只要2周足够了,所以题目没法继续以往的说法,写给2018年5月底仍在坚持的自己了...

2018-06-02 00:02:33 930

原创 18年4月读书摘要

    大学里的一个老师说过,看完一本书你只要能记住一句话就很厉害了,不需要记住太多。当时还觉得这还不简单,说实话,还真是不简单,每次看完的书,隔段时间基本上忘得一干二净...

2018-04-28 00:00:00 286

原创 公众号一周年——写给2018年3月仍在坚持的自己

公众号终于一年了,给自己鼓个掌。    自从心血来潮,想起来把学习笔记整理公布出来,当时给自己定了一个觉得挺难的目标---100篇,还真是达成了。学习python也算是爱好的一种驱动,就觉得这么神奇的软件,能爬虫,大众普及,不试试他的威力,岂不可惜,在R学了一段时间之后,果断转到python上来,一年的时间,断断续续,笔记经过二次编辑,二次学习,还真是把爬虫学上道了。因为这个公众号,还督促自己整理

2018-04-06 00:00:00 716

原创 看完这几篇笔记,你也会用Python爬虫了

学习python爬虫需要的知识图谱:页面相关的知识:1、HTML知识概况2、CSS知识概况3、JavaScript知识概况爬虫的各种知识框架:4、爬虫知识1:了解爬虫知识体系、安装Scrapy等模块5、爬虫知识2:Scrapy框架介绍,建立第一个蜘蛛6、爬虫知识3:seletors选择器、Xpath、 BeautifulSoup使用案例7、爬虫知识4:Requests模块介绍8、爬虫知识5:常见反

2018-04-06 00:00:00 535

原创 看完这几篇笔记,你也会用Python爬虫了

学习python爬虫需要的知识图谱:页面相关的知识:1、HTML知识概况2、CSS知识概况3、JavaScript知识概况爬虫的各种知识框架:4、爬虫知识1:了解爬虫知识...

2018-04-06 00:00:00 481 1

原创 公众号一周年——写给2018年3月仍在坚持的自己

    公众号终于一年了,给自己鼓个掌。    自从心血来潮,想起来把学习笔记整理公布出来,当时给自己定了一个觉得挺难的目标---100篇,还真是达成了。学习python...

2018-04-06 00:00:00 491 1

原创 爬虫知识9:scrapy框架自定义类及扩展

scrapy框架中每一步都是可以通过自定义类或者扩展来完成你要实现的特定的功能。一般自定义的类和扩展都是有一些特定的方法的。完成自定义类和扩展有两个步骤:1)在spiders同级创建任意目录,根据特定的方法,自定义类,后者在middleware.py中直接之定义。2)在setting中启用自定义的类。本文介绍的案例:案例1:去重url类案例2:自定义pipeline案例3:自定义代理池ip的应用案

2018-04-05 00:00:00 1695

原创 爬虫知识8:数据存储的需求实现,Item、Pipeline介绍

scrapy提取的信息可以保存在文件(csv、txt、json)中,或者数据库中。而scrapy中的Pipeline则是专门用来保存数据的模块。    以下以爬取豆瓣TOP250电影为例,分别介绍4种不同的数据保存和展示方式。且在案例3和案例4分别介绍了item和pipelines的知识案例1:不保存到文件,只在屏幕打印出来。直接用print语句即可。案例2:保存到文件,但不使用items返回数据

2018-04-05 00:00:00 998

原创 Python爬虫案例3:爬取房天下房价等各种信息

爬取房天下网站,爬取的内容:区域、小区名、总价、房型、面积、单价、朝向、楼层位置、装修情况、建筑时间、是否有电梯、产权类型、住宅类型、发布日期信息保存:保存在csv中数据结果:1、先建立爬虫项目1)进入目标目录:cd 目标目录2)建立项目:scrapy startproject 爬虫项目名称3)进入爬虫项目目录,cd 爬虫项目所在的文件夹4)建立爬虫:scrapy genspider 爬虫名称 网

2018-04-05 00:00:00 16106 28

原创 Python爬虫案例2:获取抽屉网页所有的新闻标题并保存到csv

1、先建立爬虫项目1)进入目标目录:cd 目标目录2)建立项目:scrapy startproject 爬虫项目名称3)进入爬虫项目目录,cd 爬虫项目所在的文件夹4)建立爬虫:scrapy genspider 爬虫名称 网址具体可参考豆瓣的爬虫博文。2、编写爬虫程序有五个注意和修改的地方:1)编写spider程序,我的案例是spider的test.py的文件中2)新建一个一个去重url的类dup

2018-04-05 00:00:00 1682

原创 Python爬虫案例4:爬取上海各区学校以及其对口学区房信息

哪个区的市重点最多,哪个区的学区房最贵?终于自己爬虫搞定这些信息了。爬取的信息字段:region_name:学校所在区域school_name:学校名称school_type:学校类型(小学or中学等)school_level:学校等级(区重点、市重点、普通等)school_advantage:学校特色aver_price_m2:对应学区房均价(单价)public_private:学校性质(公立o

2018-04-05 00:00:00 2148 3

原创 Python爬虫案例3:爬取房天下房价等各种信息

爬取房天下网站,爬取的内容:区域、小区名、总价、房型、面积、单价、朝向、楼层位置、装修情况、建筑时间、是否有电梯、产权类型、住宅类型、发布日期信息保存:保存在csv中数据...

2018-04-05 00:00:00 2668

原创 Python爬虫案例4:爬取上海各区学校以及其对口学区房信息

哪个区的市重点最多,哪个区的学区房最贵?终于自己爬虫搞定这些信息了。爬取的信息字段:region_name:学校所在区域school_name:学校名称school_ty...

2018-04-05 00:00:00 1815

原创 爬虫知识9:scrapy框架自定义类及扩展

    scrapy框架中每一步都是可以通过自定义类或者扩展来完成你要实现的特定的功能。一般自定义的类和扩展都是有一些特定的方法的。完成自定义类和扩展有两个步骤:1)在s...

2018-04-05 00:00:00 1303

原创 爬虫知识8:数据存储的需求实现,Item、Pipeline介绍

   scrapy提取的信息可以保存在文件(csv、txt、json)中,或者数据库中。而scrapy中的Pipeline则是专门用来保存数据的模块。    以下以爬取豆...

2018-04-05 00:00:00 608

原创 Python爬虫案例1:手把手教你爬取豆瓣TOP250电影各种信息

从建立爬虫,到运行成功,一步步跟着来即可。本文有两个案例;案例1:从建立爬虫项目开始,一步步教你如何获取电影名称和网址案例2:更高级一点,爬取电影名称、导演、演员、评分、...

2018-04-05 00:00:00 2399 1

原创 Python爬虫案例2:获取抽屉网页所有的新闻标题并保存到csv

1、先建立爬虫项目1)进入目标目录:cd 目标目录2)建立项目:scrapy startproject 爬虫项目名称3)进入爬虫项目目录,cd 爬虫项目所在的文件夹4)建...

2018-04-05 00:00:00 509

原创 爬虫知识6:自动登录与cookies的应用

普通请求使用scrapy.Request类就可以实现,但是遇到模拟表单或Ajax提交post请求的时候,Request类就不如子类FormRequest类方便了,因为他自带formdata 专门用来设置表单字段数据,默认method也是POST。4个github自动登录案例:案例2:模拟表单数据fromdata,发送formrequest请求。完成github自动登录案例3:利用登录成功的cook

2018-03-30 00:00:00 1128

原创 爬虫知识2:Scrapy框架介绍,建立第一个蜘蛛

1、Scrapy介绍:    Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。主要用来帮助你下载网页、解析网页、自定义一些模块。我们只需专注于提取数据就好了;    Scrapy 使用了Twisted异步网络库来处理网络通讯,可以加快我们的下载速度,而不用自己去实现异步框架。    Scrapy整体架构大致如下:Scrapy主要包括了以下组件:引擎(Scrapy Engine)

2018-03-30 00:00:00 577

原创 爬虫知识5:常见反爬虫机制——User-Agent和代理IP设置

常见反爬机制:1、拒绝非浏览器的访问:可以检查请求头header中的User-agent、referer、cookies:User-agent用来表示请求者的信息,可以搜集User-agent并保存,爬取过程中动态更换在User-agent,伪装成浏览器的形式referer可以使用浏览器分析提取referer信息需要登录才能操作的页面可以保留cookies,带着cookies信息登录2、请求延时:

2018-03-30 00:00:00 5699

原创 爬虫知识7:scrapy的settings配置文件中各参数解释以及如何自定义类

建立完爬虫项目之后,都会有如下的结构:其中,settings.py文件是存放配置文件用的,初始化的settings文件,只有以下四个变量是默认定义好的,其他都是注释掉的。现在从上往下,看下每个变量的含义。1)BOT_NAME:爬虫项目的名字,每个爬虫去爬取网站时,都会在user-agent带着这个爬虫名字去爬取网站。2)SPIDER_MODULES、NEWSPIDER_MODULE:爬虫的路径3)

2018-03-30 00:00:00 1010 1

原创 爬虫知识4:Requests模块介绍

爬虫需要掌握的一些知识图谱:    如果不使用爬虫框架scrapy,也利用一些爬虫模块也可以自定义爬虫的过程,比如 Python标准库中提供的urllib、urllib2、httplib,但是这些模块已经有些过时了,而Requests是使用Apache2 Licensed许可证的,其在Python内置模块的基础上进行了高度的封装,从而使得Pythoner进行网络请求时,变得美好了许多。1、requ

2018-03-30 00:00:00 333

原创 爬虫知识1:了解爬虫知识体系、安装Scrapy等模块

1、爬虫的知识介绍及相关概念    网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。通过爬虫爬取数据后,你就可以做一些数据分析、展示等工作。1)知识图谱    要掌握爬虫,除了一些python中一些基础的语法、函数、模块、面向对象等知识,还需要

2018-03-30 00:00:00 615

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除