- 博客(8)
- 收藏
- 关注
原创 python-matplotlib-作图分析
频数-histfrom matplotlib import pyplot pyplot.hist()
2017-04-20 16:03:17 388
原创 python-时间序列
应用场景时间戳(timestamp):一个时间点 固定时期(period):全年或全月 时间间隔(interval):从哪里到哪里时间 datetimefrom datetime import datetime now.year, now.mouth, now.day #时间的属性时间差delta = datetime(2011,1,7) - datetime(2001,2,3) delta.d
2017-04-20 14:52:42 851
原创 python-字符编码
python内部使用的是Unicode编码,但是外部读取的时候有各种各样的编码。源代码在读取字符的时候,首先是将字符看做是ASCII编码,所以当我们读取中文字符串的时候就会出错。解决的方法就是让python知道文件中的字符是什么编码格式。常见的有utf-8,gbk等编码。如果文件中的编码是utf-8的话,那么需要在第一行加这样一句话: # -*- coding: utf-8 -*- 但是Wi
2017-04-20 14:21:23 225
原创 样本不平衡--SMOTE算法-学习笔记
1 SMOTE算法的简单理解一个数集中的数据是分布在特征空间中的,假设数据是2维的,那么数据的就是一个平面上的点。对于类别不平衡数据来说,假设负样本数据是少量的,那么这个数据只占据了空间的一小部分。SMOTE 算法就是对这些小样本数据占据的空间中进行插值。 而不影响到正样本的空间。2 如何插值SMOTE算法采取了一种策略,选择两个距离接近的点进行插值。
2017-04-17 17:11:48 4015
原创 算法学习笔记--背包、队列、栈(1)
1. 引言 背包、队列和栈其实就是一组对象的集合。他们的不同之处就在于删除、访问和顺序不同。在java中使用泛型和迭代可以方便的使用这些集合。 2. 背包 背包就相当于生活中的背包,目的就是收集元素并迭代便利所有收集到的元素,它没有顺序和删除。平时在一些与计算顺序和结果无关的场景下可以使用,在java中使用foreach便利所有元素。 3.队列 先进先出,就像生活中的排对,这是一种很公平
2017-04-07 22:05:19 289
原创 集成学习-学习笔记
集成学习集成学习由多个个体学习器组成,如果集成是‘同质’的(即所有个体学习器是同一种算法)那么这些个体学习器称为基学习器(base learner)。‘异质’的称为‘组件学习器’(component learner).个体学习器应满足两个条件 准确性 多样性 第一,如果学习器不准确,那么也就没用了;第二,如果学习器没有多样性那么再多的个体学习器也等于一个学习器,并没有数量上的优势。一、boostin
2017-04-04 22:03:06 346
原创 决策树学习笔记
决策树学习笔记决策树的形成是一种递归的方法。一、递归1 递归返回三种情况会导致递归返回: 1. 当前包含的样本全属于同一类别划分,无需再划分 2. 当前属性集为空,或是所有样本在所有属性上取值相同,无法划分 3. 当前节点包含的样本集合为空,不能划分2 划分选择随着不断的划分,我们希望决策树的每个分支结点所包含的类别尽可能相同,即‘纯度’越来越高。 纯度又可以用以下两种方式表示: 1
2017-04-04 20:52:59 429
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人