自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Iceforest的博客

数据分析数据挖掘学习者,机器学习游客

  • 博客(22)
  • 收藏
  • 关注

转载 R语言中的scale函数及标准化和归一化的理解

在不同组数据间存在差异时,经常要进行标准化或者归一化处理,标准化,归一化及scale的具体理解见https://blog.csdn.net/tanzuozhev/article/details/50602051,待我日后英文水平高了之后也自行查看...

2018-04-27 19:37:06 18524

原创 Kaggle|Give Me Some Credit信用卡评分建模分析(R语言)

1.目的    本文是基于Kaggle|Give Me Some Credit项目(数据地址:https://www.kaggle.com/c/GiveMeSomeCredit),通过对消费者的人口特征、信用历史记录、交易记录等大量数据进行系统的分析、挖掘数据蕴含的行为模式、信用特征,发展出预测行的模式,结合信用卡评分的构建原理,采用R语言完成数据的清洗,主要包括缺失数据的填充、异常的删除和数据的...

2018-04-26 19:45:38 11037 2

转载 R运行错误:Error: package or namespace load failed for ‘rJava’的解决办法

转载链接:https://blog.csdn.net/peter_bell/article/details/78579187     问题:    在运行R的过程中,通常会需要调用rJava.dll来运行虚拟环境。比如,导入包library(xlsx)的时候,出错:> library(xlsx)载入需要的程辑包:rJavaError: package or namespace load fa...

2018-04-25 12:02:55 57665

原创 某招聘网站的数据分析师岗位分析

数据采集于拉钩上的数据分析师岗位,要对数据分析师这个岗位有所了解,最直观的方式就是获取企业那里获得数据分析师的岗位信息,然后进行一些探索和分析,以此来加深自己对数据分析师这个岗位的认识简要介绍一下本次爬取数据的字段信息:city(城市),companyId(公司ID),companyShortName(公司简称),education(教育程度),industryFileld(公司领域),posit...

2018-04-07 18:41:50 3017

原创 类的内置属性

isinstance(obj,cls)检查obj是否是类cls的对象issubclass(sub,super)检查sub类是否是super类的子类__getattribute__ 属性有和没有都会触发,有__getattribute__就不会再执行__getattr__,可以用raise抛出一个异常...

2018-04-06 13:39:54 198

原创 python反射

hasattr()  hasattr(object,name)判断object中有没有一个name字符串对应的方法或属性getattr(object,name,deauflt=None)  判断object中有没有name属性或方法,如果没有的话可以设置一个默认值,没有找到时会返回默认值没有的话会报错setattr(x,y,v)#设置的对象,设置的属性,设置属性对应的值delattr(x,y)#对...

2018-04-06 00:02:55 213

原创 面向对象的三大特诊:继承/封装/多态

接口继承:import abc             class Dad(metaclass=abc.ABCMeta):                    @abc.abstractmethod                    def read(self):                        pass#接口类中的方法不需要实现#定义好这个Dad类后,使用上面的语句将其转换为...

2018-04-05 23:14:24 154

原创 类和对象的知识点

类.__dict__:类的属性字典类.__name__:类的名字(字符串)类.__doc__:类的文档字符串类.__base__:类的第一个父类类.__bases__:类的所有父类构成的元组类.__module__:类定义所在的模块类.__class__:实例对应的类__init__是类的内置函数,在实例化对象时__init__函数就会自动运行静态属性使用@property在方法前面(self参数...

2018-04-05 15:48:12 231

原创 python内置模块

time模块时间戳time.time()#打印出的是秒数,从1970年开始算time.localtime()#显示的是结构化时间,当地时间time.gmtime()#显示的也是结构化时间,不过是世界标准时间将结构化时间转换成时间戳,time.mktime(time.localtime())将结构化时间转换成字符串时间,time.strftime("%Y-%m-%d %X",time.localti...

2018-04-03 14:41:31 1715

原创 含参装饰器

就是装饰器装饰的时候可以含有参数,装饰器函数在编写的时候在最外层函数中写入形参,再加一层函数返回,内层的函数可以调用外层的形参变量带参的比较少用,这里暂时不示例代码,以后再补...

2018-04-03 10:28:24 192

原创 闭包的概念

在一个嵌套函数中,内函数直接引用了外函数的临时变量,且外函数的返回值是内函数的引用,这样就构成了一个闭包在装饰器中比较常见,见过几次这个名词,不太清楚它的具体含义,记录一下,详细参见:https://www.cnblogs.com/Lin-Yi/p/7305364.html...

2018-04-03 00:27:50 205

原创 验证登陆来练习装饰器

user_dict = {'username':None,'login':False}#想不不修改调用方式的情况下加上验证的功能def auth_func(func): def wrapper(*args,**kwargs): if user_dict['username'] and user_dict['login']: res =func(...

2018-04-03 00:18:53 591

转载 strip函数(转载,侵删)

函数原型声明:s为字符串,rm为要删除的字符序列s.strip(rm)        删除s字符串中开头、结尾处,位于 rm删除序列的字符s.lstrip(rm)       删除s字符串中开头处,位于 rm删除序列的字符s.rstrip(rm)      删除s字符串中结尾处,位于 rm删除序列的字符注意:1. 当rm为空时,默认删除空白符(包括'\n', '\r',  '\t',  ' ')例...

2018-04-02 23:11:30 193

原创 装饰器基本理论

装饰器:本质就是函数,为其他函数添加附加功能原则:1.不修改被装饰函数的源代码        2.不修改被装饰函数的调用方式装饰器 = 高阶函数+函数嵌套+闭包高阶函数的定义:1.函数接收的参数是一个函数名 2.函数的返回值是一个函数名 3.满足上述条件任意一个,都可以称之为高阶函数装饰器就是这样由来的:import time#想在不修改foo函数的前提下用一个函数测出foo函数执行的时间de...

2018-04-02 22:56:39 105

原创 交换两个数的方法

中间变量过度a = 1 b =2x =aa = bb = x直接交换:a,b = b,a

2018-04-02 22:53:01 167

原创 解压序列,想单独取头或者取尾时采用

>>> l = [1,2,3,4,5,6,7,89,100]>>> a,*_,d=l>>> a1>>> d100>>> a,*b,d=l>>> a1>>> b[2, 3, 4, 5, 6, 7, 8

2018-04-02 22:43:27 158

原创 函数

def func(a,b,*args):#不定长参数 sum = a+b for i in args: sum+=i print(sum)func(5,7)func(2,3,5)#**kwargs代替的参数是键值对参数,返回的是字典形式#参数的位置没有命名的放在左边,有命名的放在右边,不定长参数的位置,*args放在左边,**kwargs放在右边...

2018-04-02 17:18:49 101

原创 集合set

把不同的元素集合在一起,重点是不同,set具有去重性集合的创建:只能通过关键字set来创建set(),set函数内的参数必须是iterable -- 可迭代对象对象,像这样会报错的集合的分类:可变集合、不可变集合可变集合set,可以添加可删除元素,set这个整体是非可hash的,不能做字典的键,也不能做其他元素的集合不可变集合frozenset:不能添加删除元素集合的访问:集合本身是无序的,所以集...

2018-04-02 11:36:53 96

原创 深拷贝、浅拷贝

直接赋值:其实就是对象的引用(别名)。浅拷贝(copy):拷贝父对象,不会拷贝对象的内部的子对象。深拷贝(deepcopy): copy 模块的 deepcopy 方法,完全拷贝了父对象及其子对象。浅拷贝需要涉及到数据在内存中如何存储,这部分可以看http://www.cnblogs.com/yuanchenqi/articles/5782764.html,里面有较为详细的图文讲解,深浅拷贝的例子...

2018-04-01 21:41:17 108

原创 迭代器、生成器

迭代器协议迭代器协议是指对象必须提供一个next方法,执行该方法用于返回迭代中的下一项,要么就引起一个StopIteration异常,从来终止迭代,也就是说迭代对象只能向下进行不能向前回滚。可迭代对象实现了迭代协议的对象(如何实现,对象内部定义一个__iter__()方法)协议是一种约定,可迭代对象实现了迭代器协议,python内部的工具如for 循环,sum,min,max等函数使用迭代器协议访...

2018-04-01 20:39:18 194

原创 列表解析式

将for循环追加生成的列表用一行写出来,精简表示egg_list = []for i in range(10): egg_list.append('鸡蛋%s'%i)print(egg_list)#用列表生成式一行搞定list = ['鸡蛋%s' %i for i in range(10)]print(list)list1 = ['鸡蛋%s' %i for i in range...

2018-04-01 20:13:11 333

原创 三元表达式

python中的三元表达式,还是比较简单的>>> num = 10>>> res = '正数' if num >= 0 else '负数'   #如果表达式的值为True,则返回第一个值,否则返回else后的值>>> res'正数'...

2018-04-01 19:38:59 264

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除