自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

donghua_wu的专栏

这个世界上永远没有百分之一百准备好的事情。最充分的准备往往意味着你错过了一切。

  • 博客(4)
  • 收藏
  • 关注

转载 使用sklearn做特征工程

1 特征工程是什么?  有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。通过总结和归纳,人们认为特征工程包括以下方面:  特征处理是特征工程的核心部分,sklearn提供了较为完整的特征处理方法,包括数据预处理,特征选

2017-05-16 11:36:00 205

原创 简单的机器学习路线

就自身而言接触机器学习和数据挖掘这个行业也就短短的不到一年的时间,在基础数学上还是略显吃力,在这里也不班门弄斧,只是就自己看到的博客和学习的内容做个简单总结下面内容引用至 机器学习与数据挖掘的学习路线图预备知识微积分(偏导数、梯度等等)、概率论与数理统计(例如极大似然估计、中央极限定理、大数法则等等)、最优化方法(比如梯度下降、牛顿-拉普什方法、变分法(欧拉-拉格朗日方程)、凸优化等等)第一条线路

2016-05-24 17:24:14 308

转载 国外程序员整理的机器学习资源大全

本文汇编了一些机器学习领域的框架、库以及软件(按编程语言排序)。C++计算机视觉CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库OpenCV—它提供C++, C, Python, Java 以及 MATLAB接口,并支持Windows, Linux, Android and Mac OS操作系统。通用机器学习MLPackDLibecog

2015-05-30 21:50:13 455

原创 数据降维的几种方法

随着数据集的增加,衍生出大数据平台和并行数据分析算法,同时数据的降维过程的使用重要性也随之凸显。数据的维度并不是越多越好,在数据分析的过程大量的数据也可能产生很差的表现效果。 现在就自己最近看的一篇文章总结降维的几种方法: Seven Techniques for Data Dimensionality Reduction(文章引用)缺失值的比例 数据列如果存在太多的缺失值是不

2015-05-15 16:37:01 3901

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除