自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 银行贷款违约风险预测

**项目简介:**比赛由 Kaggle 举办,要求选手依据客户的信用卡信息,分期付款信息,信用局信息等预测客户贷款是否会违约。一共有8个数据集,包括1个主训练集,1个测试集和6个辅助信息表,主训练集特征主要有用户的个人属性,包括用户的性别,职业,是否有车,是否有房,房子面积等基本信息,辅助信息表包括用户的历史申请信息,历史账户余额信息,分期付款信息,信用卡信息,信用局信息和在信用局上的额度信息。主训练集探索:目的:1、了解数据的缺失值情况、异常值情况,以便做对应的数据清洗2、了解一下违约贷款和正常贷

2020-08-06 17:28:19 4868

原创 CDNow用户消费行为分析

数据来自CDNow网站的一份用户购买CD明细,现在尝试从不同维度分析用户的消费行为分析内容:按月对数据进行分析:每月用户消费次数,每月用户的购买量,每月用户的购买总金额用户个体消费数据分析:用户个体消费金额与消费次数的统计描述,用户消费金额和消费次数的散点图,用户消费金额的分布图(符合二八法则),用户消费次数的分布图,用户累计消费金额的占比用户消费行为分析:用户第一次消费时间,用户最后一次消费时间,用户分层,新老客消费比,用户购买周期,用户生命周期一、理解数据import pandas

2020-08-06 17:24:24 393

原创 SQL分析用户消费行为

现有用户及用户订单的文件数据一、将数据导入数据库二、分析用户消费行为统计不同月份的下单人数统计三月份用户的回购率和复购率统计男女的消费频次是否有差异统计多次消费的用户,第一次和最后一次消费时间的间隔统计不同年龄段的用户消费金额是否有差异统计消费的top20%用户,贡献了多少额度一、将数据导入数据库1、建表订单明细表CREATE TABLE ORDERINFO ( ...

2020-08-06 17:23:57 698

原创 EXCEL常用函数

1. SUM()-SUMIF()-SUMIFS()SUM(), 求和SUMIF() ,根据条件求和,SUMIF(条件判断区域,条件,实际求和区域)eg:求员工1的业绩,则可由SUMIF(E2:E28,“员工1”,I2:I28)得到SUMIFS() ,多条件求和,SUMIFS(实际求和区域,条件判断的区域1,条件1,条件判断区域2,条件2、、、)eg:求员工1销售跑步机的金额,则可由SU...

2020-08-06 17:23:01 258

原创 歌词词云可视化

以网易云音乐为例,动态抓取指定明星的歌曲列表,保存歌词文件,去除歌词中的常用词,并对歌词进行词云展示,分析歌曲的作词风格:# -*- coding:utf-8 -*-# 网易云音乐 通过歌手ID,生成该歌手的词云import requestsimport sysimport reimport osfrom wordcloud import WordCloudimport matplotlib.pyplot as pltimport jiebafrom PIL import Imagei

2020-08-06 17:22:07 493

原创 餐饮店铺选址

项目描述:现有数据如下:任务一:从三个维度“口味”、“人均消费”、“性价比”对不同菜系进行比较,并筛选出可开店铺的餐饮类型任务二:选择一个餐饮类型(如:以素菜为例),分析得到餐饮选址位置项目分析:一、任务一计算出三个维度的指标得分评价方法:口味 → 得分越高越好 性价比 → 得分越高越好 人均消费 → 价格适中即可制作散点图二、任务二通过空间分析,分别计算每个格网内的几个指标:人口密度指标、道路密度指标、餐饮热度指标、同类竞品指标评价方法:人口密度指标 →

2020-08-06 17:09:23 418

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除