2017年04月_风可。

原创 python-matplotlib-作图分析

频数-histfrom matplotlib import pyplot pyplot.hist()

2017-04-20 16:03:17 388

原创 python-时间序列

应用场景时间戳（timestamp）：一个时间点固定时期（period）：全年或全月时间间隔（interval）：从哪里到哪里时间 datetimefrom datetime import datetime now.year, now.mouth, now.day #时间的属性时间差delta = datetime(2011,1,7) - datetime(2001,2,3) delta.d

2017-04-20 14:52:42 851

原创 python-字符编码

python内部使用的是Unicode编码，但是外部读取的时候有各种各样的编码。源代码在读取字符的时候，首先是将字符看做是ASCII编码，所以当我们读取中文字符串的时候就会出错。解决的方法就是让python知道文件中的字符是什么编码格式。常见的有utf-8，gbk等编码。如果文件中的编码是utf-8的话，那么需要在第一行加这样一句话： # -*- coding: utf-8 -*- 但是Wi

2017-04-20 14:21:23 225

原创样本不平衡--SMOTE算法-学习笔记

1 SMOTE算法的简单理解一个数集中的数据是分布在特征空间中的，假设数据是2维的，那么数据的就是一个平面上的点。对于类别不平衡数据来说，假设负样本数据是少量的，那么这个数据只占据了空间的一小部分。SMOTE 算法就是对这些小样本数据占据的空间中进行插值。而不影响到正样本的空间。2 如何插值SMOTE算法采取了一种策略，选择两个距离接近的点进行插值。

2017-04-17 17:11:48 4015

原创解决问题的思想

研究一个新问题时，最好的方法是实现一个你现在能想到的最简单的程序，当它成为瓶颈的时候再继续改进他。

2017-04-10 10:46:46 298

原创算法学习笔记--背包、队列、栈（1）

1. 引言背包、队列和栈其实就是一组对象的集合。他们的不同之处就在于删除、访问和顺序不同。在java中使用泛型和迭代可以方便的使用这些集合。 2. 背包背包就相当于生活中的背包，目的就是收集元素并迭代便利所有收集到的元素，它没有顺序和删除。平时在一些与计算顺序和结果无关的场景下可以使用，在java中使用foreach便利所有元素。 3.队列先进先出，就像生活中的排对，这是一种很公平

2017-04-07 22:05:19 289

原创集成学习-学习笔记

集成学习集成学习由多个个体学习器组成，如果集成是‘同质’的（即所有个体学习器是同一种算法）那么这些个体学习器称为基学习器（base learner）。‘异质’的称为‘组件学习器’（component learner）.个体学习器应满足两个条件准确性多样性第一，如果学习器不准确，那么也就没用了；第二，如果学习器没有多样性那么再多的个体学习器也等于一个学习器，并没有数量上的优势。一、boostin

2017-04-04 22:03:06 346

原创决策树学习笔记

决策树学习笔记决策树的形成是一种递归的方法。一、递归1 递归返回三种情况会导致递归返回： 1. 当前包含的样本全属于同一类别划分，无需再划分 2. 当前属性集为空，或是所有样本在所有属性上取值相同，无法划分 3. 当前节点包含的样本集合为空，不能划分2 划分选择随着不断的划分，我们希望决策树的每个分支结点所包含的类别尽可能相同，即‘纯度’越来越高。纯度又可以用以下两种方式表示： 1

2017-04-04 20:52:59 429

BLUE BOX