自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

BLUE BOX

计算机视觉,推荐系统,强化学习

  • 博客(8)
  • 收藏
  • 关注

原创 python-matplotlib-作图分析

频数-histfrom matplotlib import pyplot pyplot.hist()

2017-04-20 16:03:17 388

原创 python-时间序列

应用场景时间戳(timestamp):一个时间点 固定时期(period):全年或全月 时间间隔(interval):从哪里到哪里时间 datetimefrom datetime import datetime now.year, now.mouth, now.day #时间的属性时间差delta = datetime(2011,1,7) - datetime(2001,2,3) delta.d

2017-04-20 14:52:42 851

原创 python-字符编码

python内部使用的是Unicode编码,但是外部读取的时候有各种各样的编码。源代码在读取字符的时候,首先是将字符看做是ASCII编码,所以当我们读取中文字符串的时候就会出错。解决的方法就是让python知道文件中的字符是什么编码格式。常见的有utf-8,gbk等编码。如果文件中的编码是utf-8的话,那么需要在第一行加这样一句话: # -*- coding: utf-8 -*- 但是Wi

2017-04-20 14:21:23 225

原创 样本不平衡--SMOTE算法-学习笔记

1 SMOTE算法的简单理解一个数集中的数据是分布在特征空间中的,假设数据是2维的,那么数据的就是一个平面上的点。对于类别不平衡数据来说,假设负样本数据是少量的,那么这个数据只占据了空间的一小部分。SMOTE 算法就是对这些小样本数据占据的空间中进行插值。 而不影响到正样本的空间。2 如何插值SMOTE算法采取了一种策略,选择两个距离接近的点进行插值。

2017-04-17 17:11:48 4015

原创 解决问题的思想

研究一个新问题时,最好的方法是实现一个你现在能想到的最简单的程序,当它成为瓶颈的时候再继续改进他。

2017-04-10 10:46:46 298

原创 算法学习笔记--背包、队列、栈(1)

1. 引言 背包、队列和栈其实就是一组对象的集合。他们的不同之处就在于删除、访问和顺序不同。在java中使用泛型和迭代可以方便的使用这些集合。 2. 背包 背包就相当于生活中的背包,目的就是收集元素并迭代便利所有收集到的元素,它没有顺序和删除。平时在一些与计算顺序和结果无关的场景下可以使用,在java中使用foreach便利所有元素。 3.队列 先进先出,就像生活中的排对,这是一种很公平

2017-04-07 22:05:19 289

原创 集成学习-学习笔记

集成学习集成学习由多个个体学习器组成,如果集成是‘同质’的(即所有个体学习器是同一种算法)那么这些个体学习器称为基学习器(base learner)。‘异质’的称为‘组件学习器’(component learner).个体学习器应满足两个条件 准确性 多样性 第一,如果学习器不准确,那么也就没用了;第二,如果学习器没有多样性那么再多的个体学习器也等于一个学习器,并没有数量上的优势。一、boostin

2017-04-04 22:03:06 346

原创 决策树学习笔记

决策树学习笔记决策树的形成是一种递归的方法。一、递归1 递归返回三种情况会导致递归返回: 1. 当前包含的样本全属于同一类别划分,无需再划分 2. 当前属性集为空,或是所有样本在所有属性上取值相同,无法划分 3. 当前节点包含的样本集合为空,不能划分2 划分选择随着不断的划分,我们希望决策树的每个分支结点所包含的类别尽可能相同,即‘纯度’越来越高。 纯度又可以用以下两种方式表示: 1

2017-04-04 20:52:59 429

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除