自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 Oracle中的排序方法:row_number、rank、dense_rank、oder by

(作者:陈玓玏)排序是非常常见的数据处理需求,Oracle中也有很多排序的方法,下面一起看看吧。1、row_number实现分组排序后按序号取值select * from ( SELECT ROW_NUMBER() over(partition by user_id order by calltime de...

2018-07-31 22:12:55 2013

原创 Oracle中获取时间的年和月并比较大小

(作者:陈玓玏)在Oracle中,我觉得最让人头疼的就是操作Date型的数据了,比如取年月日、计算几天前、几年前、几个月前什么的。但是这个又用得很多,因为不管你做什么内容的挖掘,总是离不开时间窗口的,因为数据大多是以人为本的,而人又是善变的,所以时间是你必须非常看重的。1、Oracle中分别取年、月、日的方法--取年份Select to_number(to_char(sysdate,...

2018-07-30 22:27:30 14873

原创 Oracle中复制表的方法(create as select、insert into select、select into)

(作者:陈玓玏)在使用SQL的过程中,常常需要复制表,或者通过建立临时表来存储select语句生成的结果,这个在建模过程中造变量的时候用得尤其多。1、用create as select drop table tablename; create table tablename as select * from tab1;Oracle中删除表格不能先用if exists做判断,...

2018-07-30 22:10:37 20702 1

原创 Numpy用法入门之创建数组(arange, array, copy, empty, empty_like, eye, fromfile, fromfunction, identity, linsp)

(作者:陈玓玏)在求解系数矩阵、画图等过程中,我们总是需要创建很多初始的矩阵,那么今天就干脆来总结一下,numpy中常用的矩阵创建方法及它们的应用场景。import numpy as np#arange创建等差数列,可以是整数也可以是小数,np.array(起始值,结束值,步长),注意是左闭右开区间data = np.arange(0,1,0.1)#结果:[ 0. 0.1 0...

2018-07-29 21:26:28 2582

原创 Pandas中groupby+agg+merge及describe实现各类分组统计及一些实用技巧

(作者:陈玓玏) 在SQL中,我们可以用分析函数轻松实现变量分组后的组内max、min等结果的统计,而在Python中,使用pandas来实现这些功能也是非常简单的。pandas中也有groupby函数,能够根据特定的列将所有数据进行分组,并通过agg方法对选定的列进行分组统计,内置的统计方法有max、min、mean、var、count等,还能通过lambda或者def自定义匿名函数或者函...

2018-07-12 21:03:29 9092

原创 列表推导式和lambda匿名函数以及map、filter 、zip函数:让你的代码更简洁

(作者:陈玓玏)一、列表推导式列表推导式,故名思义,是一种很方便地快速生成列表各项的方法,而且是基于一定的可推导、可迭代的逻辑。说得简单一些,就是简化可以用for语句和if语句组合产生列表的句子。举个栗子:for i in listA: for j in listB: if i!=j: listC.append([i,j])这种...

2018-07-11 22:42:12 1050

原创 Oracle怎么判断表是否存在并drop?另有ORA-06550错误

(作者:陈玓玏)一、实现Oracle中判断表是否存在再drop通常在更新一个表时,全表更新不如直接删除表格再重建来得简单。但是drop table table_name if exists这样的写法只在MySQL里能用,在Oracle中会报错。那么Oracle中怎么实现呢?用匿名存储过程。也就是,没有create or replace procedure pro_name这句话...

2018-07-09 23:17:38 7459

原创 Oracle视图中的错误ORA-04063及ORA-04063

(作者:陈玓玏)一、错误ORA-01731: circular view definition encountered这个错误发生的情况是这样的:我希望每次都拿同一个view去逐个left join一系列的view,每次join完之后把这个view更新为join后的结果,类似序列和那样的,num=num+1,我也是写的:select a.*,b.* from viewA a l...

2018-07-09 22:45:15 48280

原创 PPT排版细节,写给大家看的设计书,完美总结

(原创作者:陈玓玏)相信每一位小宝贝在工作中都会被老板用PPT虐无数遍,虐到自己怀疑人生。奈何在网上随手一搜,出现的各类招聘要求都躲不开“熟练掌握PPT制作”,尤其是各类科技公司、咨询公司。想想Apple、华为、小米各大手机发布会的酷炫场景。 既然躲不掉,那就勇敢地迎上去,搞定它!你会发现会做PPT的人生是乳齿地美好!今天小编就来分享一下能把PPT做得好看的几个排版细节,很简单哦!...

2018-07-07 16:44:09 2728

原创 Python库的安装与卸载(含statsmodels和xgboost)

(作者:陈玓玏)Python库的安装window下python2、python3安装包的方法在线安装安装好python、设置好环境变量后,在python安装目录下Script文件夹内会存在pip.exe和easy_install.exe两种在线安装工具。只需要在cmd输入pip,可以查看pip是否可用 没有报错表示可用,在cmd中输入pip install xxx就可以...

2018-07-07 16:35:10 8754 1

原创 Oracle获取某列的数据类型及某表的所有列名

(作者:陈玓玏)在使用数据库的时候,经常会出现用create as select、insert into select这些语句来复制表的操作,但是这些操作做来做去常常把数据类型给做丢,导致最后复制出来的表大多都变成了varchar2这类的字符串型,导致在对字段使用函数时常常报错,比如对一个显示为数字但实际为字符串类型的字段做除法,会报需要一个数字但获得一个字符串这类的错。那么我有时候为了代...

2018-07-07 16:23:44 3921

原创 Oracle计算距离当前时间几天、几年、几个月的方法

(作者:陈玓玏)在建模造变量的过程中,经常需要进行时间判断,比如取近三个月的某基础数据的统计特征,此时就需要用Oracle来进行取数,但是SQL的时间格式个人认为处理起来是非常麻烦的,下面就看一下如何取吧。本文主要涉及两个功能:1、获得距离当前时间三天、三个月、三年的时间,方便进行时间大小的比较;2、获取时间距离当前时间有多少天、多少个月、多少年。一、获得距离当前时间三个月、三年的...

2018-07-07 15:58:39 16848

原创 Oracle中视图的使用及ORA-00998错误

(作者:陈玓玏)一、视图的概念及优缺点视图是从一个或多个表导出的虚拟的表,其内容由查询定义。其具有普通表的结构,但是不实现数据存储。其实视图的功能和select语句是一样的,只是避免了重复写较复杂、使用频率较高的子查询。视图的优点有:1、避免大量重复代码的出现;2、避免大量占用空间的临时表的出现;3、实现简单;4、数据的相对安全性,对于部分用户,只开放可供查询的数据,并限制其修改和...

2018-07-07 09:52:49 14857

原创 模型评估:K-S值和AUC的区别

K-S评估和AUC评估

2018-07-04 22:56:18 24461 1

原创 matplotlib在同一坐标系上绘制多条曲线 及在多个子图上绘图

(作者:陈玓玏)用matplotlib画图时,常常需要实现两类功能,一类是在一个坐标轴上画多条曲线,能够清楚地看到多条曲线的对比情况。另一种情况是在同一个窗口的不同子图上画图,多用于呈现不同内容的曲线,没有对比关系的曲线图。其实根本区别在于,是在同一对坐标轴上画图,还是在不同的坐标轴上画图。一、同一坐标系上绘制多条曲线首先自然是引入matplotlib包,这个包可以画散点图、线图、...

2018-07-04 22:11:46 55006

原创 Python生成全0二维数组及使用range、arange自动生成等差数列

(作者:陈玓玏)一、自动生成全0二维数组比如在实现逻辑回归和线性回归等算法时,需要先初始化一个权值矩阵,也就是要自动生成一个固定大小且各值全部相等的二维矩阵,这时候就可以用numpy来实现了。下面的代码就是生成一个x行y列的全为0的矩阵。import numpy as nparray = np.ones((x,y))*0二、使用range生成整数等差数列在进行fo...

2018-07-04 21:50:45 19946

原创 Oracle使用Union合并两个表的同一列及可能出现的问题,以及产生的ORA-01789、ORA-12704错误

(原创作者:陈玓玏)一、问题描述有时候可能因为一些特殊的原因,比如说数据表结构设计的改变,导致新的数据会存储在一张新开的表里。这样就会在取数时产生一些问题,比如:你需要计算所有客户在2017年1月到2018年1月这段时间内,优惠券核销的时间是什么样的分布情况,但是2017.01~2017.07这段时间存放在表1,字段是use_time,而2017.08~2018.01这段时间的数据存放...

2018-07-02 22:17:13 3585

原创 Python实现FP-growth算法寻找关联规则(含原理+代码)

(原创作者:陈玓玏)一、FP-growth应用场景FP-growth和Apriori一样,可以用于挖掘频繁项,常用于购物篮的规则提取,也就是挖掘客户购买商品时的关联程度,比如共有一万个客户购买商品,其中会同时购买牛奶和面包的客户有九千个,那就认为牛奶和面包关联性很大,适合打包销售。另外一个应用场景其本质也是关联规则,也就是在针对二分类的数据分析中,通常会对单变量进行分析,然后提取出...

2018-07-01 12:47:46 12408 7

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除