自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 收藏
  • 关注

转载 数据挖掘模型中的IV和WOE详解

1.IV的用途IV的全称是Information Value,中文意思是信息价值,或者信息量。我们在用逻辑回归、决策树等模型方法构建分类模型时,经常需要对自变量进行筛选。比如我们有200个候选自变量,通常情况下,不会直接把200个变量直接放到模型中去进行拟合训练,而是会用一些方法,从这200个自变量中挑选一些出来,放进模型,形成入模变量列表。那么我们怎么去挑选入模变

2017-09-28 15:47:17 585

原创 Python提取MySQL数据为EXCEL文件后邮件发送

1、代码使用的是Python3.6版本。 2、重点是解决提取为excel时中文乱码及邮件发送附件名称中文乱码问题。# -*- coding: UTF-8 -*-import smtplibimport email.mime.multipartimport email.mime.textimport email.mime.baseimport os.pathimport pymy

2017-03-28 15:25:55 4819 1

转载 通俗理解T检验与F检验的区别

1,T检验和F检验的由来一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很少

2016-09-22 11:36:52 8624

转载 ggplot2--legend图例的修改

> head(msleep)                        name      genus  vore        order conservation sleep_total sleep_rem sleep_cycle awake brainwt bodywt1                    Cheetah   Acinonyx carni   

2016-07-23 12:37:19 7271

原创 cx_Oracle模块安装

个人环境前提:WIN10 64位,Python3.5Python连接Oracle数据库,需要用到cx_Oracle模块,开始安装该模块1、需用由于Oracle客户端太大,因此选择使用即用客户端,下载连接如下:       http://www.oracle.com/technetwork/database/features/instant-client/index-097480

2016-06-24 11:16:48 794

转载 [SQL]-Oracle trunc()函数的用法

Oracle trunc()函数的用法1.TRUNC(for dates)  TRUNC函数为指定元素而截去的日期值。  其具体的语法格式如下:  TRUNC(date[,fmt])  其中:  date 一个日期值  fmt 日期格式,该日期将由指定的元素格式所截去。忽略它则由最近的日期截去  下面是该函数的使用情况:  TRUNC(TO_

2016-05-12 11:36:02 1277

原创 [SQL]-Oracle分组函数ROULLUP的应用

首先部分说明: Oracle的GROUP BY语句除了最基本的语法外,还支持ROLLUP和CUBE语句。如果是Group by ROLLUP(A, B, C)的话,首先会对(A、B、C)进行GROUP BY,然后对(A、B)进行GROUP BY,然后是(A)进行GROUP BY,最后对全表进行GROUP BY操作。因工作要做个报表,因此想就在数据库直接跑个报表出来,取公司部分数据整理如下:SEL

2016-05-11 10:00:43 930

原创 Python3爬虫韩寒新浪博客文章

利用Python把韩寒新浪博客每篇文章的链接找出,并把每篇文章下载为html格式文件。# -*- coding: utf-8 -*- import urllib.requesturl=['']*350#建立350个列表用来存储每篇博文的地址链接i=0page=1while page<8: #所有文章有7页,因此循环查找每一页 content=urllib.request.u

2016-03-31 15:03:55 1899

转载 【Linux】一张图让你读懂Linux内核运行原理

参考资料:http://makelinux.net/kernel_map/

2016-03-11 17:21:28 1093

原创 工作日志(二)

工作任务:项目进度日报(PPT)具体内容:项目进度人事招聘,门店开发,各地分公司注册开展进度。从人事、销售运营、行政获得每天进度数据,做相关的数据汇总提炼以表格及图表形式与PPT呈现,最后分别发送给公司管理层。任务作用:让管理层可以看到在业务上线之前,关于销售相关的事项进展情况。个人总结:1、数据核对的重要性,从数据组给出的数据正确性非常重要

2016-02-23 09:55:39 462

原创 工作日志(一)

工作任务:报表需求调查具体内容:向各地城市经理发送报表需求调查表(表格自定),从反馈的邮件信息中做提取汇总归类,得出对于报表里面指标及报表频率的需求。任务作用:日后业务开展需要向各地销售经理提供报表,而报表需要按照什么频率提供(日报,周报,月报?),报表里面指标需要包含些什么,需要给到什么指标来帮助销售经    理们查看自己的工作情况,统计所有的量化指标既有助于我们设定报表框架,也有助于销

2016-02-02 11:46:26 461

原创 Python输出字符奇数位置

给你一个字符串 a, 输出字符奇数位置的字符串。如a=‘12345’,则输出135。b=[a[i],for i in range(len(a)) if i%2==0]print(''.join(b))if i%2==0(如果i除以2余数为0)函数说明 1、join()函数语法: ‘sep’.join(seq)参数说明 sep:分隔符。可以为空 seq:要连接的元素序列、字符串、元组、字典

2016-01-19 17:19:09 13715

原创 Python中的axis=0,axis=1

axis=0表述列 axis=1表述行如下面例子:In [52]: arr=np.arange(12).reshape((3,4))In [53]:arrOut[53]:array([[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11]])In [54]:np.concatenate([arr,arr],axi

2016-01-19 15:37:27 29772 5

原创 利用VBA实现多个EXCEL表格合并

工作小作业-多表合并多个excel表格,字段都一样,内容数据不同,利用VBA实现数据合并到一张表格Sub text1()Application.ScreenUpdating = FalseDim x As Integer, y As IntegerDim wb As Workbook, wbb As Workbookf = Dir(ThisWorkbook.Path & "\*" & ".x

2015-12-28 10:42:07 9166 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除