自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

一粒飞鸿丶的博客

金融、数据分析

  • 博客(47)
  • 收藏
  • 关注

原创 银行贷款客户拉新活动分析——数据分析项目实战

1、案例背景Thera Bank是一家拥有不断增长客户群的银行。这银行中大多数客户的存款规模都是不一样的。由于贷款业务的客户数量很少,所以银行希望有效地将存款用户转化为贷款用户以此扩大贷款业务量的基础,以带来更多的贷款业务,并在此过程中,通过贷款利息赚取更多。因此,该银行去年为存款用户但未办理个人贷款业务的客户开展了一项推广活动来促使其办理个人贷款业务,有部分客户通过此活动已经办理了相关服务。这时的零售营销部门希望制定更好的策略去定位营销,以最小的预算提高成功率。该部门希望识别出更有可能购买贷款的潜在客

2020-07-30 22:27:37 2894 4

原创 《数据挖掘工程师实战》— 电信运营商:客户流失预警

数据分析算法应用之客户流失预警实战四、分析与准备数据—开会与讨论State:州名/区域Account Length:账户长度Area Code:区号Phone:电话号码‘Int’l Plan:国际漫游需求与否VMail Plan:参与活动VMail Message:语音邮箱Day Mins:白天通话分钟数Day Calls:白天打电话个数Day Charge:白天收费情况Eve Mins:晚间通话分钟数Eve Calls:晚间打电话个数Eve Charge:晚间收费情况Ni.

2020-07-27 21:45:23 1297

原创 金融风控建模实战——以某银行客户数据制作评分卡(A卡)

一、知识准备1.1 熟悉Python的数据分析库numpy、pandas和scikit算法库1. 2 熟悉逻辑回归和随机森林算法二、项目主题 在银行借贷场景中,评分卡是一种以分数形式来衡量一个客户的信用风险大小的手段,它衡量向别人借钱的人(受信人,需要融资的公司)不能如期履行合同中的还本付息责任,并让借钱给别人的人(授信人,银行等金融机构), 造成经济损失的可能性。一般来说,评分卡打出的分数越高,客户的信用越好,风险越小。 这些”借钱的人“,可能是个人,有可能是有需...

2020-07-17 18:09:40 3868 1

原创 SQL刷题笔记——GROUP_CONCAT()函数

GROUP_CONCAT()函数1.完整语法group_concat([DISTINCT] 要连接的字段 [Order BY ASC/DESC 排序字段] [Separator '分隔符'])-- 13、查询和"01"号的同学学习的课程完全相同的其他同学的信息 SELECT Student.*FROM StudentWHERE s_id IN (select s_id from score GROUP BY s_id HAVING s_i

2020-06-04 20:29:17 286

原创 SQL进阶学习——列转行

列转行一、使用UNION ALL1.原始数据:(4个季度的销售金额分为四列)给定一个公司所有员工各个季度销售金额的表格employee_sales:2.查询语句问题:依据 employee_id,把四个字段的数据放到一个字段中。思路:可以先查询出四个字段,然后用UNION ALL 组合。SELECT employee_id,employee_name,'一季度',sales_amount_q1 from employee_sales UNION ALLSELECT .

2020-06-02 11:57:46 476

原创 SQL进阶学习——行转列

行转列一、找出每个同学的各科成绩SELECT student_id,student_nameMAX(CASE WHEN subject_name = '高等数学'THEN score ELSE 0 END) AS'高等数学',MAX(CASE WHEN subject_name = '机械原理'THEN score ELSE 0 END) AS'机械原理',MAX(CASE WHEN subject_name = '概率论'THEN score ELSE 0 END) AS'概率论',MA

2020-06-01 21:34:50 223

原创 SQL必知必会补充学习——CASE WHEN逻辑转换

CASE WHEN逻辑转换语法一、适用于条件表达式为一定的范围CASE WHEN 条件表达式1 THEN 结果表达式1CASE WHEN 条件表达式2THEN 结果表达式2...ELSEEND例:根据交易数量,判断大单中单小单SELECT volume,CASE WHEN volume>=3000 THEN '大单' WHEN volume>300 AND volume<3000 THEN '中单' ELSE '小单'ENDFR.

2020-06-01 16:55:24 510

原创 《谁说菜鸟不会数据分析——入门篇》学习笔记 ——第七章 图表专业化

一、别让图表犯错1.让图表五脏俱全(1)标题、图例单位、脚注、资料来源要全2.注意事项(1)饼图A.数据从12点钟顺时针排列B.数据项保持在5项以内C.不要使用爆炸式的饼图分离,可以分离出要强调的一项D.不要使用图例、3D效果E.白色边框线填充(2)树状图与旭日图成分超5块考虑树状图旭日图用来表达清晰的层级和归属关系,便于溯源分析,了解事物构成(3)柱形图注意:A.同一序列相同颜色B.不要使用倾斜标签C.纵坐标轴刻度从0开始.

2020-05-20 17:52:47 408

原创 《谁说菜鸟不会数据分析——入门篇》学习笔记 ——第六章 数据展现

一、图表1.图表的作用形象化表达、突出重点、体现专业化2.图表的类型表格、饼图、条形图、柱状图、折线图、散点图3.图表的选择通过数据间的关系选择图表4.图表的制作确定主题、确定图表、选择数据、检查效果二、表格1.突出显示单元格2.数据条3.图标集4.迷你图三、图表换装1.平均线图2.双坐标图3.竖形折线图主要用途:衡量产品功能、品牌形象等指标在消费者心中的评价,用于市场研究、商业咨询。4.帕累托图(1)定义:帕.

2020-05-20 13:28:36 407

原创 《SQL必知必会》学习笔记——第十六课 更新和删除数据

第十六课 更新和删除数据一、更新数据(1)SET命令将新值赋给被更新的列UPDATE infSET age = '69',city = 'F'WHERE id = 5;二、删除数据(1)delect from指定要删除数据的表名;WHERE子句过滤要删除的行DELETE FROM score2WHERE id = 1;...

2020-05-20 10:20:32 199

原创 《SQL必知必会》学习笔记——第十五课 插入数据

第十五课 插入数据一、数据插入1.插入完整的行(1)注意:给出列名更安全INSERT INTO scoreVALUES('7','55','7');INSERT INTO score(id,score,rank)VALUES('8','54','8');(1)注意:被忽略的行允许NULL值;表定义中要给出默认值INSERT INTO score(id)VALUES('9');3.插入检索出的数据(1)注意:可以使用WHERE,.

2020-05-20 08:57:45 192

原创 《SQL必知必会》学习笔记——第十四课 组合查询

第十四课 组合查询一、组合查询1.使用情况(1)在一个查询中,从不同的表返回结构数据(2)对一个表执行多个查询,按一个查询返回数据二、创建组合查询1.使用UNION(1)对一个表执行多个查询,按一个查询返回数据(2)注意:对于复杂的过滤条件或从多表检索数据时,UNION更简单。SELECT id, age, genderFROM infWHERE city in ('C','D')UNIONSELECT id, age, genderFROM infWHE.

2020-05-20 08:21:57 230

原创 《SQL必知必会》学习笔记——第十三课 创建高级连结

第十三课 创建高级连结一、使用表别名二、使用不同类型的连结1.自连结(1)自连结用来替代从相同表中检索数据所使用的子查询语句SELECT i1.id,i1.age,i1.cityFROM inf as i1,inf as i2WHERE i1.city = i2.cityAND i2.name = 'allen';2.自然连结SELECT score.*,inf.id,inf.age,inf.cityFROM inf LEFT OUTER JOIN

2020-05-14 22:18:39 179

原创 《SQL必知必会》学习笔记——第十二课 连结表

第十二课 连结表一、创建连结SELECT inf.id,age,rankFROM inf,scoreWHERE inf.id = score.id;注意 WHERE inf.id = score.id 作为过滤条件,没有的话会输出笛卡尔积。二、内连结SELECT inf.id,age,rankFROM inf INNER JOIN scoreON inf.id = score.id;INNER JOIN的连结条件使用ON子句达到与WHERE一样的效果...

2020-05-14 21:38:10 191

原创 《SQL必知必会》学习笔记——第十一课 使用子查询

第十一课 使用子查询一、子查询过滤SELECT id,rankFROM scoreWHERE id in (SELECT id FROM inf WHERE age = 22)注意:子查询只能是单列二、作为计算字段SELECT id,age,(SELECT COUNT(*)FROM scoreWHERE inf.id = score.id) AS c_scoreFROM infORDER BY age;...

2020-05-14 20:46:14 176

原创 《谁说菜鸟不会数据分析——入门篇》学习笔记 ——第五章 数据分析

一、数据分析方法1. 现状分析1.1 对比分析法(1)指标QQ分析模型quantity、quality(2)维度同级类别比、不同时期比、与目标比、行业内比1.2 分组分析法(1)定性分组(2)定量分组1.3 结构分析法(1)在分组的基础上,计算各部分比重,分析总体的内部构成特征。1.4 分布分析法(1)将数值型数据等距或不等距分组1.5 交叉分析法(1)分析两个或两个以上分组变量,数据透视表1.6 RFM分析法(1)根据客...

2020-05-14 20:28:19 310

原创 《SQL必知必会》学习笔记——第十课 分组数据

第十课 分组数据一、创建分组 Group BYSELECT age,gender,cityFROM infGROUP BY age;二、过滤分组 HAVING注意:having过滤分组;where过滤行SELECT age,gender,cityFROM infWHERE age>23GROUP BY ageHAVING gender >=1;三、分组和排序注意:GROUP BY 只能对SELECT列使用;order by 对所有列都.

2020-05-13 18:56:18 137

原创 《SQL必知必会》学习笔记——第九课 汇总数据

第九课 汇总数据一、聚集函数(1)定义:对某些航运行的函数,计算并返回一个值1.1 AVGSELECT AVG(age) AS avg_ageFROM infWHERE YEAR(birthday) = 2020ORDER BY id;1.2count函数(1)对age列非NULL的行进行计数SELECT count(age) AS num_ageFROM infWHERE YEAR(birthday) = 2020ORDER BY id;(2)对表...

2020-05-13 18:40:26 169

原创 《SQL必知必会》学习笔记——第八课 使用函数处理数据

第八课 使用函数处理数据一、文本处理函数(1)LEFT() LENGTH() LOWER LTRIM() RTRIM() RIGHT() UPPER()(2)SOUNDEX() 将文本转语音 P67二、日期和时间处理函数SELECT ageFROM infWHERE YEAR(birthday) = 2020ORDER BY id;MYSQL里用yea...

2020-05-13 18:14:46 180

原创 《SQL必知必会》学习笔记——第六课 用通配符进行过滤

第六课 用通配符进行过滤一、LIKE操作符(1)定义:用来匹配值的一部分的特殊字符(2)搜索模式:由字面值、通配符或者两者组合构成的搜索条件,如:WHERE name LIKE '%a%'1.1 百分号(%)通配符SELECT name,genderFROM infWHERE name LIKE '%a%';(1)注意:区分大小写、匹配不了NULL1.2下划线(—)通配符SELECT name,cityFROM infWHERE city LIKE '..

2020-05-13 10:15:27 170

原创 《SQL必知必会》学习笔记——第七课 创建计算字段

第七课 创建计算字段一、计算字段1.1 字段(1)在数据库中列一般被称为字段(2)SQL计算字段比在客户端更快二、拼接字段SELECT CONCAT(RTRIM(NAME),' (' ,RTRIM(city),')')AS name_cityFROM infORDER BY name;(1)拼接(cancatenate——[kənˈkætnˌeɪt])(2)MySQL中用Concat( , )(3)TRIM函数去除空格,RTRIM()去右边,LTRIM()去右边.

2020-05-13 09:10:01 231

原创 《SQL必知必会》学习笔记——第五课 高级过滤数据

第五课 高级过滤数据一、组合WHERE子句1.1 AND操作符SELECT id,age,genderFROM infWHERE age = 22 AND gender =1;AND都要符合1.2 OR操作符SELECT id,age,genderFROM infWHERE age BETWEEN 16 AND 30 or gender =1;OR子句任意条件匹配即可1.3 求值顺序SELECT id,age,genderFROM infWHER...

2020-05-12 21:53:51 142

原创 《SQL必知必会》学习笔记——第四课 过滤数据

第四课 过滤数据一、 使用WHERE子句SELECT id,age,cityFROM infWHERE age>20ORDER BY 2 ,3 DESC;注意:(1)WHERE子句同样在FROM子句之后给出(2)order by 子句同样放在最后二、WHERE子句操作符1.检查单个值SELECT id,age,cityFROM infWHERE age>20ORDER BY 2 ,3 DESC;2.不匹配度检查SELECT id,ag..

2020-05-12 21:31:57 188

原创 《SQL必知必会》学习笔记——第三课  排序检索数据

第三课 排序检索数据3.1 排序数据SELECT scoreFROM scoreORDER BY rank;注意:(1)SQL语句由很多子句构成。(2)ORDER BY子句须在最后。3.2按多个列排序SELECT id,age,cityFROM infORDER BY age,city;注意:(1)优先按照age排序,当且仅当age相同时按照city排序3.3 按列位置排序SELECT id,age,cityFROM infORD...

2020-05-12 20:58:08 126

原创 《SQL必知必会》学习笔记——第一课 了解SQL

第一课 了解SQL一、数据库基础1.1 数据库(1)定义:保存有组织的数据的容器(通常是一个文件或一组文件)(2)注意:数据库软件,如MySQL,应称为数据库管理系统(DBMS),而数据库是通过DBMS创建和操纵的容器。1.2 表(1)定义:某种特定类型数据的结构化清单。(2)注意:同一类型的数据或清单(3)模式:关于数据库和表的布局及特性的信息1.3 列和数据类型(1)列:表中的一个字段(2)数据类型:每个列所允许的数据的类型,起限制作用1.4 行(1)

2020-05-12 19:38:41 189

原创 《谁说菜鸟不会数据分析——入门篇》学习笔记 ——第四章 数据处理

第三章 数据处理一 、数据处理简介1.1 定义根据数据分析的目的,将收集到的数据进行加工整理,以形成适合数据分析要求的样式。1.2 常用方法数据清洗、数据抽取、数据计算、数据转换二 、数据清洗2.1 定义筛选清除多余重复数据,补充完整缺失的数据,纠正或删除错误的数据。2.2 常用方法重复数据处理、缺失数据处理、空格数据处理2.3 重复数据处理(1)函数法COUNTIF(range,criteria)对区域中满足单个指定条件的单元格进行计数...

2020-05-12 12:43:30 267

原创 《SQL必知必会》学习笔记——第二课  检索数据

第一章 检索数据1.1 检索单个列SELECT nameFROM inf;注意:(1)一般结尾要加分号(;)(2)SQL语句不区分大小写(3)所有空格均被忽略1.2 检索多个列SELECT id,name,genderFROM inf;注意:(1)列名之间加逗号,最后一个列名不加逗号1.3 检索所有列SELECT *FROM inf;* 通配符,能检索出名字未知的列1.4 检索不同的值SELECT genderFROM i...

2020-05-11 19:54:16 166

原创 《谁说菜鸟不会数据分析——入门篇》学习笔记——第三章 结构为王,确定分析思路

第二章 结构为王,确定分析思路一 、数据分析方法论1.1常用的数据分析方法论(1)PEST分析法用于宏观环境分析(政治、经济、技术、社会)(2)5W2H分析法用于企业营销、管理活动,考虑和分析问题等,如用户购买行为分析何因(why)、何事(what)、何人(who)、何时(when)、何地(where)、如何做(how)、何价(how much)(3)逻辑树分析法主要用于理清思路,避免重复和无关思考。(4)4P营销理论产品(product):有形产品、服务、人员、

2020-05-11 18:23:15 203

原创 《谁说菜鸟不会数据分析——入门篇》学习笔记 ——第二章 数据分析概述

第一章 数据分析概述一 、什么是数据分析(狭义)1.1 定义数据分析是指根据分析目的,用适当的分析方法及工具,对数据进行处理与分析,提取有价值的信息,形成有效结论的过程。1.2 作用(1)现状分析(发生了什么)具体体现为企业整体运营好坏程度、各项业务构成及发展变动,一般通过日报、周报、月报等形式完成。(2)原因分析(为什么发生)确定业务变动的具体原因,需要我们分析确定是整体业务的问题还是个别业务问题、是所有地区的问题还是个别地区的问题等等,一般需要专题分析。(...

2020-05-10 18:05:54 1039

原创 数据分析学习——numpy、pandas

1.numpy numpy主要是用array将数据转换为数组,提高C语言底层函数的计算效率。可直接进行加减乘除运算,而列表不可以。import numpy as npprint(np.array([1, 2, 3]))C:\Users\Administrator\venv\Scripts\python.exe D:/描述性统计作图/zft.py[1 2 3]Proc...

2020-01-30 10:36:32 336

原创 SQL join

1.SELECT count(t.companyId)/count(1) FROM data.dataanalyst as d#where companyId = (#select companyId from data.company#where companyShortName = '唯医网'#)left join (SELECT * FROM data.companywhe...

2019-03-30 11:53:52 200

原创 SQL函数

1.left/locate,函数组合获取薪资下限SELECT left(salary,locate('k',salary)-1),salary FROM data.dataanalyst;8 8k-15k 20 20k-40k 10 10k-18k 8 8k-16k 10 10k-18k 15 15k-30k 16 ...

2019-03-30 10:30:08 136

原创 SQL:Group by

1.Group by 对数据进行分组,类似于Excel里的数据透视表1.1SELECT city,count(positionId),count(1),count(*) FROM data.dataanalystgroup by cityoutput:上海 979 979 979 北京 2347 2347 2347 南京 ...

2019-03-26 11:13:51 220

原创 SQL条件查找

1.SELECT * FROM data.dataanalystwhere (city = '上海'and education = '本科')or (city = '北京'and education = '硕士')2.SELECT * FROM data.dataanalystwhere secondType like '后端%'...

2019-03-26 10:17:59 496

原创 用Python进行简单的图片数字识别(1)

一、源代码from PIL import Imageim = Image.open("F:/result/4.jpg")# 先将图片转为固定宽高如55*55以符合一行txt文件im = im.resize((55,55))fh = open("F:/result/7.txt", "a")width = im.size[0]height = im.size[1]# k = ...

2019-03-11 19:45:18 7292

原创 KNN算法

一、 实现步骤1.处理数据2.数据向量化3.计算欧几里得数据4.根据距离进行分类# shape函数是numpy.core.fromnumeric中的函数,它的功能是读取矩阵的长度,比如shape[0]就是读取矩阵第一维度的长度。'''二、代码示例import numpy as npimport operatordef knn(k, testdata, train...

2019-03-11 17:58:26 193

原创 python建模概述

一、数据建模概述数据建模是对现实中的各种数据的抽象组织,建立一个合适的模型对数据进行处理。数据建模所依赖的算法:分类、聚类、关联、回归等二、python数据分类实现过程:1.明确需求并对数据进行观察2.确定算法3.确定步骤4.编程实现三、常见的分类算法1.KNN算法2.贝克斯方法3.决策树4.人工神经网络5.支持向量机(SVM)...

2019-03-11 17:53:27 6208

原创 利用Python进行文本相似度分析

from gensim import corpora,models,similaritiesimport jiebafrom collections import defaultdictdoc1 = &quot;F:/result/1.txt&quot;doc2 = &quot;F:/result/3.txt&quot;d1 = open(doc1,encoding=&quot;utf-8&quot;).read()d2 = ope

2019-03-11 16:15:38 5784 9

原创 文本挖掘

import jiebasentence = “我喜欢上海东方明珠的联邦调查局模式的天善智能舞蹈袜”w1 = jieba.cut(sentence,cut_all=True) # 全模式for item in w1:print(item)w2 = jieba.cut(sentence,cut_all=False) # 精准模式切分结果,很简洁,没有叠加for item in ...

2019-03-07 22:55:07 122

原创 数据规约

属性规约 降维 主成分分析 PCA数值规约from sklearn.decomposition import PCAimport pandas as pdimport numpy as npdata = pd.read_excel(“F:/result/b.xls”)删除有缺失值的行data.dropna(inplace=True)主成分分析pca1 = PCA()pca1...

2019-03-07 16:32:19 796

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除