- 博客(24)
- 资源 (2)
- 收藏
- 关注
转载 评分卡建模流程
核心代码讲解: 注解:核心代码也是参考之前人的代码,理解的;希望读者引用时候,也附上本作者地址 def split_cut_result(data, get_col_continuous_cut_points): cols = [i for i in data.columns if i not in [i[0] for i in get_col_continuous_cut_points]] data_cut_result = data[cols].copy() for c...
2020-11-03 22:57:06
444
原创 python与机器学习快速入门第二章
#coding=utf-8 ''' 数组的结构认识和理解 numpy就是一个矩阵数据库 scipy:线性代数数据库 两个相结合 矩阵结构理解: [[ 1. 1. 1. 1.] [ 1. 1. 1. 1.] [ 1. 1. 1. 1.]] 由于 [ 1. 1. 1. 1.] [ 1. 1. 1. 1.] [ 1. 1. 1. 1.], 这三...
2018-09-09 16:25:27
196
原创 Python与机器学习快速入门第一篇
#coding=utf-8 ''' 数组的结构认识和理解 numpy就是一个矩阵数据库 scipy:线性代数数据库 两个相结合 矩阵结构理解: [[ 1. 1. 1. 1.] [ 1. 1. 1. 1.] [ 1. 1. 1. 1.]] 由于 [ 1. 1. 1. 1.] [ 1. 1. 1. 1.] [ 1. 1. 1. 1.], 这三...
2018-09-09 16:17:51
286
原创 Python快速学习第十一课
#coding=utf-8 ''' Created on 2018年9月9日 创建字典方式很多,只要中间有个逗号即可。 访问字典 字典的基本操作 @author: Administrator ''' from __builtin__ import dict, zip from pickle import DICT #字典创建 infoa=[(2,3),(4,6)] a=dict(infoa)...
2018-09-09 13:25:31
230
原创 Python快速学习第十课
#coding=utf-8 ''' Created on 2018��9��9�� @author: Administrator ''' str1='adcde\"This is a Text"' #拆分方法 s=str1.split('\"')[1] print s print str1.index('\"') #title方法 if str1.istitle(): print s...
2018-09-09 13:24:57
436
原创 Python快速学习第九课
#coding=utf-8 ''' Created on 2018��9��9�� @author: Administrator ''' #排序 Jscores=[9,8,5,6,7,2,0,1] ascore=11 Jscores.sort(cmp=None, key=None, reverse=False) print Jscores #列表pop Jscores.pop() print ...
2018-09-09 13:24:24
465
原创 python快速学习第八课
#coding=utf-8 ''' Created on 2018��9��9�� @author: Administrator 序列(字符串,列表和元祖),以及序列中常见的通用函数 字符串其实是一个对象。 标注类型运算符 序列运算操作 序列类型转换操作 ''' from audioop import reverse #标注类型运算符 print 'apple' <"banana" ...
2018-09-09 13:23:30
366
原创 Python快速学习第七课
#coding=utf-8 ''' Created on 2018年9月8日 @author: Administrator 文件读写操作 ''' #写文件 fr=open(r"E:\abc.txt",'w') fr.write("author is wangpeng!!!!!!!\n") fr.write("author is zhangsan!!!!!!!\n") fr.write("a...
2018-09-09 13:22:41
161
原创 python快速学习第六课
#coding=utf-8 ''' Created on 2018年9月8日 @author: Administrator 自定义函数,不需要返回类型。Python不管干什么都不需要定义类型,当然也没有返回值。 lambda:匿名函数和Scala很像。 ''' def add(x,y): print x+y def sub(): print "111" def isPrime...
2018-09-09 13:22:10
142
原创 Python快速学习第五课
#coding=utf-8 ''' Created on 2018��9��8�� 顺序结构 if,elif,else 循环结构:while,foreach @author: Administrator ''' a=3 b=4 if a<1: print a-1 elif a<2: print a-2 else: print a print "\n" #f...
2018-09-08 23:55:15
270
原创 Python快速学习第四课
#coding=utf-8 ''' #coding=utf-8 Created on 2018��9��8�� @author: Administrator 内置函数:直接调用 模块:导入函数,需要引入模块 from module import function. 库:相关模块的集合 包:包里面可以包含模块和子包,和库。 帮助函数;help ''' from __builtin__ imp...
2018-09-08 23:54:00
157
原创 Python快速学习第四课
#coding=utf-8 ''' #coding=utf-8 Created on 2018��9��8�� @author: Administrator 内置函数:直接调用 模块:导入函数,需要引入模块 from module import function. 库:相关模块的集合 包:包里面可以包含模块和子包,和库。 帮助函数;help ''' from __builtin__ imp...
2018-09-08 23:00:11
412
原创 Python快速学习第三课
#coding=utf-8 ''' Created on 2018��9��8�� @author: Administrator 本章内容: Python和数学表达式。 逻辑运算符 and or not 转义字符 r ''' a= 3.3/2 print a #和数学一样。 b=3.3//2 print b #和程序中的除号一样 c=3.3...
2018-09-08 22:02:14
269
原创 Python快速学习第二课
#coding=utf-8 ''' Created on 2018年9月8日 @author: Administrator 本章知识点: 基本数据类型 复数类型 bool类型存储 基本的数据结构 基本的函数使用 ''' from scipy.special._ufuncs import it2j0y0 n1 = 3 print type(n1) #数据类型函数<type...
2018-09-08 21:46:53
230
原创 python快速入门第一课
#coding=utf-8 ''' 本章知识点: 基本的输入和输出。 换行键 \ {} 表示: () 表示缩进 ''' ''' 段落注释 ''' #行注释 # raw_input 返回的是char类型。 ''' s= raw_input("请输入数字") print s+1 #报错,char类型 ''' # input 返回的是 int类型 n= input("...
2018-09-08 21:27:03
189
原创 R语言机器学习篇
机器学习算法有很多,主要围绕着线性和非线性。非线性的学习也是围绕着线性来解读的。 线性回归: > x <- c(1,2,3,4) > y <- c(4,6,7,11) > lm(formula = y~x) ...
2018-08-31 00:14:11
3776
原创 R语言图表操作
图表有很多,重点介绍几种图表 ①直方图: 直方图不同于条形图,因其是连续的(条形的:条条框框的,直方的,直线式) v <- c(9,13,21,8,36,22,12,41,31,33,19) hist(x = v,main = "histogram",col = "red",border = "yellow") ②箱线图: 箱线图是数据集中的数据分布良好的度量。 它将数据集分...
2018-08-30 23:06:46
864
原创 R语言frame操作
1.为什么要介绍frame? 之所以介绍frame,是因为frame就是sql中的表,数据分析其实都是围绕着表来的。 2.frame有哪些操作 既然围绕着表来操作,那么想想sql中怎么玩的,都有哪些函数 ①创建frame emp.data <- data.frame(emp_id <- c(1,2,3,4,5), + emp_n...
2018-08-30 21:19:56
3421
原创 R语言加载包和装载数据集
(1)编写程序离开不了调用函数,那么就有可能需要引包。 包操作: ①引包 引包,必须数据库已经安装了该包。 引包语句:library(discoverR) ②可以查询包的安装位置 查询语句:.libPaths() ③可以查询目前自己的库里安装了哪些包 查询语句: library() (2)编写程序离开不了了数据集,那么就有可能需要加载...
2018-08-30 20:46:01
14377
原创 R语言数据类型与数据对象
1.前言 每种语言都有一定的数据类型,也必有其提供的数据对象(常用数据结构) 2.数据类型 a <- TRUE //逻辑类型,即编程语言中的boolean类型。 print(mode(a)) //logical,逻辑类型 b <- 23.5 print(mode(b))//numeric,数字类型 c <- 15L class(c)//返回的是inte...
2018-08-08 18:12:37
598
原创 R语言环境篇
1.简介 R是一门数据分析语言,现在貌似比Python还流行,Spark中既提供了Python也提供了R接口。但是其学习难度也往往比较大。 2.R的环境认识 下载R官网上提供的软件,最后成这个样子(R还有一个好的集成开发工具RStudio): 、 3.R常用说明 1)R和其他语言都需要安装相关包,才能具备相关函数功能 安装方式分为离线和在线 ①离线...
2018-08-08 17:33:28
1261
原创 回忆数据库
1.绪论 本科读书那会开始学数据库,研究生开始搞大数据和机器学习,一直到参加各种面试,发现数据库真是太重要了,更有甚者是现在在一家大数据公司从事数据挖掘,了解了很多的大数据产品,基本上当我们使用工具去访问数据的时候,其操作方式主要有以下几种:①是提供终端界面(dos窗口或者linux终端)②利用sql语句进行操作数据和访问数据(一般用于复杂式查询)③是某个领域专业的工具,如利...
2018-07-07 22:36:56
209
原创 入职报到的感受
从学生生涯走向工作岗位,刚开始对什么都不太了解,只知道在北京,上海这样的城市来回穿梭,需要不断的努力。第一天来就安排酒店住宿,环境挺好,公司给新员工配发一台高配笔记本电脑,供员工作和生活。第二天首先是培训公司内部的产品,以前在学校期间学习的大数据知识,现在看来都只不过是一些入门的基础,尽管感觉不难,但是时间仓促,培训几天就需要考试了,好的公司内部都有自己的大数据产品(整个一站式大数据平台),独立于...
2018-07-06 14:11:48
729
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅