自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Cyber的博客

专注Python的菜鸟一枚

  • 博客(10)
  • 收藏
  • 关注

原创 Python:把多张图片放在同一个word中

前言:在原部门的最后一天,有个需求,需要分两步完成。第一步:有一堆照片在同一个文件夹下,根据excel读取规则,如下图因为比较乱,所以需要把图片放在一个个按“门店名称”创建的文件夹下,以供部门同事后续核对from PIL import Imagefrom docx import Documentfrom docx.shared import Inchesfrom docx impo...

2019-12-31 10:39:16 5353 1

原创 CDA第11届Level2建模案例题Python代码实现

一、前言:本次考试案例题的难度要高于模拟题,时间只有2个小时且不能上网,而且还是银行业这种稍微有点专业的行业,所以难度颇高。现在的这份答案是我考试后花了2个小时才做出来的,也就是加上考试的原代码总共花了4个小时。里面涉及到一些新的数据清洗方法,包括了.loc、字符串分列、上采样等方法,仅供参考。二、案例内容根据相同的背景材料和数据实作以下的分类模型,最终须提交对测试数据的预测结果。题目...

2019-12-29 09:11:00 2842 7

原创 CDA Level2 模拟题2 Python代码实现

前言: 模拟题2是一道2分类预测类建模,需要预测利润而不是传统的准确率或召回率等,这就代表用一个模型是没有办法获得最高分的,必须根据不同的情况进行调参。虽然没有答案,但是好在有一个类似的练习赛地址是: http://jingsai.cda.cn/info/id/6.html需要注意的是:1、练习赛的数据集小于模拟题的数据集,不要搞混了;2、练习赛的评判标准是accuracy接下去的代...

2019-12-25 15:58:36 2326 1

原创 CDA Level2 模拟题1 Python代码实现

前言: 由于是模拟题,且除了数据清洗外没有答案,所以建模部分没有做特征工程,用了最简单的随机森林的分类树且没有做交叉验证甚至没有调参,也就是说用这个代码的话顶多弄个及格分。一、数据下载:http://exam.cda.cn/static/exam_attachment/L2jmjxshiti.zip二、案例背景和要求:三、Python代码实现1、数据导入import panda...

2019-12-25 09:59:12 2149 10

原创 Python:3个常用数据检验代码实现

常规库导入import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport warningswarnings.filterwarnings("ignore")pd.options.display.max_columns = None #显示所有列pd.set...

2019-12-24 15:47:57 3165

原创 Python:14个常用数据清洗代码

常用库导入import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport warningswarnings.filterwarnings("ignore")pd.options.display.max_columns = None #显示所有列pd.set...

2019-12-23 15:16:51 14560 5

原创 七种常用监督类预测模型的特征、优缺点整理

2019-12-20 15:00:14 4079 5

原创 使用Python计算基尼系数

import numpy as npdef gini(data_list): '''获得列表中的gini系数''' data_length = len(data_list) total_sum = np.sum(data_list) total_gini = 0 for i in range(data_length): temp_deno...

2019-12-19 15:03:49 10017 1

原创 Pandas:一个apply+lambda的小技巧

前言:有两张表,有一个关键字段作为连接,要比对两张表里某个值的变化,用Python该怎么写呢?excel很简单,vlookup+if即可;SQL里的话,就是left join,然后再case whenpython里的思路也是一样,我们需要merge后再apply以下表为例如果不用lambda,只用apply的话,代码如下:import pandas as pddef get_va...

2019-12-19 10:35:04 1692

原创 CDA LEVEL2 大纲解析案例题Python实现代码

数据下载:http://exam.cda.cn/static/exam_attachment/L2jmjxshiti.zip导入库import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport warningswarnings.filterwarnings...

2019-12-16 11:04:28 2291

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除